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致谢 (英文 版 第 2 版) 


自 本 书 第 1 版 出 版 以 来 的 十 年 中 ， 分 层 模型 的 有 关 方 法 得 到 了 长 足 的 发 
R. 并 且 在 各 领域 中 得 到 了 广泛 的 运用 - 因此 ， 可 以 说 ， 本 书 第 2 版 一 方面 是 
原作 者 之 间 长 期 大 量 合作 的 成 果 ， 另 一 方面 也 是 与 更 多 其 他 同事 合作 与 讨论 的 
成 果 。 需要 感谢 太 多 的 人 、 但 存 此 处 不 能 一 一 列 出 。 无 论 如 何 ， 其 中 一 些 人 是 
必须 提 到 的 。 引 是 因为 有 了 他 们 ， 本 书 才 最 终 得 以 付 梓 ， 

与 Darrell Bock, Yuk Fai Cheong, Sema Kalaian Rafa Kasim, Xiaofeng Liu 
和 Yasuo Miyazaki 等 人 在 方法 论 十 的 讨论 ， 不断 地 挑战 着 我 们 的 想法 。Yeow 
Meng Thum 的 工作 启发 了 本 书 第 6 章 和 第 11 竟 中 有 关 多 元 分 析 的 应 用 ， 
Mike Seltzer 对 第 13 章 的 贝 叶 斯 方法 提出 了 极为 重要 且 非 常 有 用 的 批评 ， 并 
慷慨 地 允许 将 其 研究 成 果 作 为 最 后 一 个 例子 加 入 该 章 。Meng-Li Yang 和 Ma- 
theos Yosef 在 分 层 一 般 化 线性 模型 (第 10 章 ) 中 所 用 的 最 大 似 然 估计 方法 
的 发 展 上 做 了 基础 工作 。Young-Yun Shin 仔细 阅读 了 本 书 的 初稿 ， 并 提出 了 
许多 建设 性 意见 - Guang-lei Hong 对 初稿 提出 的 批评 意见 促使 了 第 12 章 交互 
分 类 模型 的 形成 。 作 为 应 用 程序 员 和 长 期 的 朋友 ，Richard Congdon 的 工作 体 
现在 本 书 的 每 一 章 中 。Stuart Leppescu 也 为 第 2 版 的 数据 处 理 和 新 的 分 析 提 
供 了 协助 。 

世 加 车 社 区 人 类 发 展 项 目 (the Project on Human Development in Chicago 
Neighborhoods, PHDCN) 中 的 同事 ， 包 括 Felton Earls, Rob Sampson 和 Christo- 
pher Johnson， 都 对 本 书 第 2 版 有 着 重要 影响 ， 这 体现 在 第 10 章 和 第 11 章 中 关 
社区 效应 的 例子 。 的确， 我 们 还 要 感谢 麦克 阿 瑟 基 金 会 〈the MacArthur 
Foundation) 、 国 家 司法 研究 所 (the National Institute of Justice) 和 国家 精神 卫 
生 研 究 所 《the National Institute of Mental Health) 对 芝加哥 社区 项 目的 资助 ， 
它 也 支持 了 本 版 新 章节 中 关键 性 方法 论 方面 的 工作 

我 们 特别 感谢 Pamela Gardner， 她 帮助 检查 、 编 辑 并 录入 了 本 书 的 全 稿 。 
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她 的 高 效率 和 幽默 感 是 保证 整个 工作 顺利 进行 的 基础 。 

及 名 评论 者 对 这 一 版 的 新 章节 提出 了 许多 有 六 的 建议 。 作 为 Sage 出 版 
社 的 方法 论 编辑 C. Deborah Laughton 对 本 书 的 出 版 给 予 了 令 人 钦佩 的 而 
心 和 精神 上 的 支持 ; 我 们 还 要 再 次 感谢 系列 丛书 的 主编 Jan de Leeuw 的 
鼓励 、 


丛书 主编 对 分 层 线性 模型 的 介绍 


在 社会 科学 中 ， 数 据 结构 经 常 在 以 下 意义 上 是 分 层 的 : 我 们 有 描述 个 体 的 
变量 ， 但 是 个 体 又 组 成 较 大 的 群体 ， 每 一 群体 由 一 定数 量 的 个 体 组 成 。 对 于 较 
大 样 体 还 有 一 系列 变量 来 描述 。 

首 推 的 例子 也 许 是 教育 。 学 生 组 成 班级 ， 既 有 变量 描述 学 生 ， 义 有 变量 描 
述 班级 。 班 级 变量 也 许 是 学 生变 量 的 汇总 指标 ， 诸 如 学 生 数 量 或 社会 经 济 状况 
的 平均 值 。 但 是 班级 变量 也 可 以 是 教师 (如 果 本 班 只 有 一 个 教师 ) ， 或 者 是 本 
班 的 教室 (如果 本 班 总 是 皮 会 于 同一 教室 )。 此 外 ， 在 这 个 例子 中 ， 层 次 结构 
还 会 相当 自然 地 延伸 。 班 级 还 会 进一步 组 成 学 校 ， 学 校 构成 校区 ， 等 等 。 我 们 
也 可 以 有 描述 学 校 的 变量 和 描述 校区 的 变量 ( 如 教学 方式 、 学 校 建筑 、 邻 里 
状况 ， 等 等 ) 。 

一 旦 我 们 发 现 这 个 分 层 数 据 结 构 的 例子 ， 我 们 就 会 看 到 更 多 的 例子 。 它 们 
自然 地 发 生 于 地 理 和 (区域 ) 经 济 中 。 从 同一 意义 出 发 ， 社 会 学 的 基本 问题 
就 是 将 个 人 属性 与 所 帘 于 其 中 的 群体 和 结构 的 属性 联系 起 来 。 以 同一 方式 ， 经 
济 学 的 问题 是 将 微观 层次 与 宏观 层次 联系 起 来 。 此 外 ,许多 重复 测量 也 是 分 层 
的 。 如 果 我 们 不 断 追 踪 调 查 一 些 个 体 ， 那 么 对 任 一 个 体 的 观察 构成 一 组 测量 ， 
按照 同一 方式 ， 一 个 学 校 或 班级 也 构成 组 测量 。 当 每 个 调查 员 调查 一 组 对 象 
时 ， 调 查 员 使 处 于 较 高 层次 。 只 要 对 这 些 分 层 结构 多 加 思索 便 会 不 可 避免 地 导 
致 一 个 结论 ， 即 使 不 能 说 大 多 数 ， 至 少 也 能 说 很 多 社会 科学 数据 都 有 这 种 拭 套 
的 或 分 层 的 结构 。 

在 意识 到 分 层 数 据 的 重要 意义 之 后 ， 下 一 步 是 考虑 如 何在 统计 技术 中 体现 
对 分 层 结构 的 分 析 。 有 两 种 做 法 已 经 遭 到 否定 : 第 一 种 做 法 是 将 所 有 高 层 变量 
分 解 (disaggregate) 到 个 体 水 平 。 比 如 将 教师 、 班 级 和 学 校 的 特征 全 都 赋予 学 
生 个 人 ， 然 后 在 个 体 层 次 进行 分 析 。 这 一 方法 的 问题 是 ， 要 是 我 们 知道 一 些 学 
生 是 同一 班级 的 ， 那 么 我 们 也 就 知道 他 们 在 班级 变量 上 取 相 同 的 值 ， 于 是 ， 我 
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们 使 不 能 采用 经 典 统计 技术 中 的 基本 假定 ， 即 各 观测 之 问 相 互 独立 。 另 一 种 做 
法 是 先 将 个 体 水 平 的 变量 汇总 到 较 高 层次 ， 然 后 在 较 高 层次 进行 分 析 。 比 如 我 
们 将 学 生 特 征 汇总 到 班级 ， 然 后 青 进 行 班级 的 分 析 ， 分 析 时 也 许 还 需要 按 规模 
对 班 线 加 权 。 这 种 做 法 的 主要 问题 是 ， 我 们 抛弃 了 所 有 的 组 内 信息 ， 它 也 许 占 
到 最 初 分 析 时 信息 总 量 的 80% 或 90% 。 其 结果 是 ， 汇 总 变量 之 间 的 关系 总 是 
显得 较为 密切 ， 然 而 这 常常 与 直接 分 析 未 曾 汇总 的 变量 所 反映 的 情况 大 相 径 
庭 。 于 是 ， 我 们 不 但 浪费 了 信息 ， 而 且 要 是 我 们 企图 在 个 体 层 次 解释 汇总 分 析 
结果 ， 还 将 导致 对 结果 的 曲解 。 所 以 ， 汇 总 方法 和 分 解 方法 都 不 能 令 人 满意 。 

如 果 仅 限于 用 常规 线性 模型 进行 分 析 ， 我 们 知道 其 基本 假定 有 线性 、 正 态 
性 、 方 差 齐 性 、 独 立 性 。 我 们 希望 保留 前 两 项 ,但 需要 对 后 两 项 (尤其 是 关 
于 独立 性 的 假定 ) 加 以 修改 ， 修 改 的 主要 原因 在 于 : 由 于 同 组 的 个 体 之 间 比 
异 组 的 个 体 之 间 更 为 接近 或 相似 ， 所 以 一 个 学 生 与 其 他 班级 的 学 生 可 能 是 相 独 
立 的 ， 而 与 同一 班级 的 学 生 则 在 许多 变量 上 相同 。 那 么 ， 这 些 变 量 并 不 需要 观 
察 ， 这 意味 着 它们 从 线性 模型 中 消失 ， 进 入 误差 部 分 ， 并 导致 残 差 之 间 出 现 相 
关 。 这 一 思路 可 以 用 方差 成 分 模型 来 做 公式 表达 。 残 差 之 间 可 分 为 组 成 分 和 个 
别 成 分 丙种。 个 别 成 分 之 间 相 互 独立 ， 组 与 组 之 间 也 是 独立 的 ， 而 组 成 分 与 组 
特征 完全 相关 《 即 组 内 不 独立 ) .一些 组 可 能 比 另 一 些 组 有 更 强 的 方差 齐 性 ， 
即 这 些 组 的 组 内 成 分 方差 有 所 不 同 ， 

对 这 一 思路 的 公式 表达 也 可 采取 稍微 不 同 的 形式 。 假 定 每 一 个 组 都 有 不 同 
的 回归 模型 ， 在 简单 回归 的 情况 下 ， 每 个 组 都 有 自己 的 截 距 和 斜率 。 由 于 各 组 
都 是 通过 抽样 得 到 的 ， 因 此 我 们 假定 这 是 以 组 为 单位 构成 的 总 体 的 组 截 距 和 组 
斜率 的 随机 样本 。 这 定义 了 一 套 随 机 系数 的 回归 模型 。 要 是 我 们 仅仅 假定 它们 
的 截 距 是 随机 的 ， 而 令 所 有 的 斜率 相同 ， 其 实 我 们 面 对 的 正 是 前 面 提 到 过 的 方 
差 成 分 研究 的 情况 。 要 是 允许 斜率 也 可 以 随机 变化 ， 这 套 模 型 的 情况 便 更 为 复 
杂 ， 残 差 的 协 方差 将 依赖 于 个 体 层 次 自 变量 的 取 值 。 

在 随机 系数 的 回归 模型 中 ， 也 仍然 不 能 与 较 高 层次 的 〈 比 如 描述 班级 或 
FRA) 变量 相 联 系 。 为 了 达到 这 一 目的 ,我 们 需要 多 层 模 型 ， 其 中 以 组 为 
单位 的 模型 还 是 线性 模型 。 于 是 我 们 假定 ， 学 业 能 力 测试 值 这 一 学 生变 重 的 余 
率 与 班级 规模 或 教师 特征 等 班级 变量 之 间 星 线性 关系 。 所 以 ， 在 每 一 层次 都 有 
一 套 线 性 模型 ， 要 是 存在 很 多 层次 ， 便 有 很 多 其 套 的 线性 模型 。 于 是 ， 我 们 便 
有 了 一 刺 套 反映 分 层 结 构 的 模型 ， 使 各 个 层次 的 变量 联系 起 来 。 

直到 大 约 10 年 前 ， 拟 合 这 样 的 模型 才 在 技术 上 成 为 可 能 。 大 约 与 此 同时 ， 
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Aitkin 和 Longford, Goldstein 及 其 合作 者 , 以 及 Raudenbush 和 Bryk 纷纷 发 表 了 
有 关 分 析 技 术 及 其 相应 的 计算 软件 。 其 中 ， 由 Bryk 和 Raudenbush 研制 的 HLM 
软件 对 用 户 最 友好 、 在 技术 上 也 最 完善 ， 并 且 他 们 还 及 时 地 发 表 了 一 系列 既 有 
说 服 力 又 有 意思 的 范例 。 在 本 书 中 ，Bryk 和 Raudenbush 详细 地 描述 了 这 种 模 
型 、 其 计算 方法 ， 以 及 有 关 程 序 和 范例 。 我 认为 ， 现 在 来 对 这 一 技术 方法 提供 
一 个 完整 的 介绍 是 既 重 要 又 及 时 的 。 分 层 线 性 模型 (hierarchical linear mod- 
els) ， 或 称 多 层 模型 (multilevel models) ， 当 然 不 能 解决 社会 科学 中 所 有 的 数 
据 分 析 问 题 ， 因 为 它们 还 是 建立 在 线性 关系 和 正 态 分 布 假设 基础 之 上 的 模型 ， 
并 且 它 们 所 研究 的 仍 是 相对 简单 的 回归 结构 ， 只 是 其 中 一 些 变量 依赖 于 其 他 变 
量 。 然 而 ， 它 们 在 技术 层面 上 已 经 从 汇总 和 分 解 的 做 法 上 向 前 迈 了 一 大 步 ， 这 
主要 是 因为 它们 在 统计 原理 上 是 正确 的 ， 并 且 还 避免 了 信息 的 浪费 。 

我 认为 ， 这 本 书 的 主要 贡献 在 于 通过 一 系列 例题 的 分 析 示 范 为 读者 提供 了 
清晰 的 概念 。 本 书 对 各 种 不 同 层次 的 模型 做 了 清楚 的 分 类 ， 同 时 又 未 完全 割断 
其 间 的 联系 。 读 者 可 以 分 别 把 握 某 一 层次 中 可 能 的 机 制 ， 然 后 再 将 不 同 层次 的 
模型 联系 起 来 进行 分 析 。 未 来 ， 这 些 技术 会 对 教育 研究 以 及 地 理学 、 社 会 学 和 
经 济 学 的 研究 产生 重要 影响 ， 直 到 它们 也 过 到 其 自然 限制 。 为 了 避免 这 些 限 
制 ， 这 些 模型 还 将 扩展 (并且 已 经 扩展 ) 到 更 多 层次 ,扩展 到 多 元 数据 ， 扩 
展 到 通 径 分 析 、 潜 在 变量 、 名 义 因 变量 以 及 一 般 化 线性 模型 ， 等 等 。 社 会 统计 
学 家 将 有 能 力 建立 更 为 广泛 的 模型 ， 并 且 可 以 在 更 多 模型 中 进行 选择 。 如 果 他 
们 能 够 建立 起 必要 的 前 提 信 息 条 件 ， 作 为 从 这 一 模型 各 类 型 中 进行 合理 选择 的 
依据 ， 那么 可 望 取得 更 强 的 能 力 和 精度 。 请 把 这 一 思想 记 存心 底 ， 因 为 你 将 使 
用 这 本 书 来 探索 这 一 类 新 兴 而 又 令 人 兴奋 的 技术 方法 。 


处 书 主 编 Jan de Leeuw 
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本 书 的 第 1 版 一 直 很 畅销 ， 这 说 明 本 书 提供 的 技术 细节 水 平 适合 许多 社会 
科学 和 行为 科学 研究 人 员 的 需要 。 它 还 包括 了 足够 的 实际 操作 建议 和 研究 示 
范 ， 并 且 与 相应 的 HLM 软件 结合 起 来 ， 因 此 本 书 对 许多 人 而 言 还 是 多 层 分 析 
的 手册 和 用 户 指南 。 然 而 ， 已 经 过 了 10 年 ， 本 书 现在 需要 加 以 更 新 了 。 

在 这 !0 年 间 ， 多 层 分 析 又 有 了 很 大 的 发 展 。 在 社会 科学 和 行为 科学 领域 ， 
这 一 技术 如 同 野 火 歼 延 ， 研 究 者 已 经 发 表 了 很 多 应 用 成 果 。 在 某 些 领域 ， 分 层 
线性 模型 (HLM) 已 经 成 为 数据 分 析 的 典范 ， 基 础 软件 包 已 经 通用 化 ,并且 
有 日益 完善 。 更 为 重要 的 是 ,混合 模型 (多 层 模型 是 其 中 一 个 特 类 ) 也 在 统计 
学 中 占据 了 主导 地 位 。 尤 其 是 非 线 性 混合 模型 和 一 般 化 线性 混合 模型 
(GLMM)， 已 经 成 为 统计 学 和 生物 统计 学 中 最 活跃 的 研究 领域 的 基础 。 这 方面 
的 研究 已 经 导致 许多 令 人 鼓舞 的 理论 和 计算 方面 的 发 展 。 

如 果 我 们 比较 本 书 的 第 1 版 和 第 2 版 ， 最 明显 的 变化 是 增加 了 4 章 全 新 的 
内 容 。 第 10 章 包括 了 分 层 一 般 化 线性 模型 ， 抒 CLMM 模型 的 一 个 重要 分 类 ， 
这 些 模型 容许 研究 者 来 处 理 整 数值 的 结果 变量 (如 计数 、 频 率 、 率 、 比 例 )。 
第 11 章 增 加 了 对 潜在 变量 所 做 的 分 层 模型 ， 包 括 了 测量 误差 和 分 项 反应 模型 。 
第 12 章 将 标准 的 多 层 嵌 套 假设 一 般 化 ， 于 是 容许 了 更 为 复杂 的 交互 分 类 设计 。 
第 13 章 从 贝 叶 斯 估计 角度 对 分 层 模 型 进行 评述 ， 并 讨论 了 马尔 可 夫 链 的 蒙特 
卡 网 计算 方法 。 这 4 章 都 是 与 前 10 年 中 多 层 分 析 最 活跃 的 研究 领域 相 呼 应 的 ， 
并 且 呼 应 了 基础 计算 机 软件 包 (如 HLM 和 MLWin) 中 新 近 增加 的 功能 。 每 一 
章 都 放松 了 第 1 章 【和 第 1 版 ) 中 的 一 些 关 键 假定 条 件 ， 这 意味 着 ， 到 了 最 
后 ,我 们 其 实 已 经 是 在 处 理 很 大 一 族 模型 和 技术 方法 了 。 

第 1 版 中 的 技术 附录 已 经 由 新 的 第 14 章 的 估计 理论 所 取代 。 这 一 - 章 从 技 
术 细 节 上 上 讨论 了 中 时 斯 估计 和 最 大 似 然 估计 的 方法 及 其 相应 的 计算 问题 。 此 
外 ， 这 一 章 还 包括 了 最 新 的 发 展 ， 比 如 对 似 然 函 数 的 拉 普 拉 斯 近似 估计 。 要 是 
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我 们 仔细 比较 这 两 个 不 同 版 本 ， 还 可 以 发 现 第 2 版 对 第 1 版 的 几 百 处 修订 和 
增补 。 

我 曾经 多 次 在 别 的 地 方 评论 说 ， 分 层 线性 模型 已 经 很 好 地 确立 起 来 ， 然 而 
这 些 异 型 在 许多 方面 并 没有 得 到 充分 的 理解 。 所 以 ， 例 常 性 的 应 用 还 未 得 到 实 
现 ， 也 许 永 远 也 不 能 实现 。 新 的 一 版 比 前 一 版 的 内 容 更 为 深入 ， 还 讨论 了 功 
效 、 样 本 规模 、 数 据 的 预 处 理 (如 对 中 处 理 ) 等 各 个 方面 ， 这 为 我 们 提供 了 
对 这 一 技术 的 基本 理解 。 当 然 ， 由 于 新 增 章节 增加 了 (更 多 ) 更 复杂 的 模型 
及 其 更 复杂 的 计算 步 又， 在 研究 与 数据 分 析 之 间 的 分 界线 有 所 改变 ， 并 且 还 介 
绍 了 很 多 不 能 算是 例 常 情况 的 选项 。 阅 读 这 本 书 并 不 能 使 你 成 为 所 有 这 些 不 同 
领域 的 专家 ， 但 是 可 以 使 你 了 解 这 些 选 项 是 什么 ， 你 可 以 在 哪里 找到 你 需要 的 
专家 ， 你 可 以 向 他 问 什么 问题 。 

在 这 两 个 版 本 的 比较 中 ， 我 们 还 注意 到 ， 作 者 们 感到 他 们 工作 和 贡献 的 平 
衡 有 所 倾斜 ， 以 至 于 署名 的 顺序 发 生 了 变化 ， 因 此 在 行为 料 学 和 社会 科学 中 多 
层 分 析 标 准 文本 的 署名 顺序 已 经 不 再 是 Bryk 和 Raudenbush (1991) ， 而 成 了 
Raudenbush 和 Bryk (2001)。 对 于 在 这 些 领域 工作 的 统计 人 员 来 说 ， 最 重要 的 
问题 可 能 是 : “我 是 否 应 该 更 新 ?” 回 答 是 肯定 的 。 你 会 得 到 比 前 一 版 多 一 倍 
的 材料 ， 并 且 这 些 材 料 更 加 新 颖 ， 更 加 整合 ， 介 绍 了 统计 研究 中 一 些 最 令 人 鼓 
舞 的 新 领域 。 此 外 ， 你 的 工具 箱 中 还 会 加 入 许多 新 奇 的 、 有 发 展 前 景 的 工具 。 
而 我 们 ， 作 为 编辑 ， 十 分 自豪 我 们 的 系列 丛书 能 够 得 到 这 样 的 更 新 。 


丛书 主编 Jan de Leeuw 


中 文 版 译 者 序 


《分 层 线性 模型 : 应 用 与 数据 分 析 方 法 》 (第 2 版 ) 的 中 文 版 终于 与 读者 
见面 了 。 

分 层 线性 模型 是 1990 年 代 在 国际 上 形成 并 正在 迅速 推广 应 用 的 新 统计 分 
析 技 术 。 由 美国 芝加哥 大 学 的 Bryk 教授 和 密 软 根 州立 大 学 的 Raudenbush 教授 
于 1992 年 合 著 的 《分 层 线性 模型 : 应 用 与 数据 分 析 方 法 》 是 这 一 统计 分 析 方 
法 的 代表 作 之 一 。 

我 是 在 1990 年 代 后 期 才 知 道 这 种 分 析 方 法 的 。2000 年 ， 在 美国 执教 的 朋 
友 王 丰 博 士 送 给 我 此 书 。 在 研读 中 ， 我 深 为 其 方法 论 上 的 推进 和 其 广泛 的 应 用 
性 所 吸引 。 

此 书 既 是 一 本 专著 ， 也 可 以 作为 教材 ， 因 为 作者 实际 上 是 按 教材 体例 写 
的 。 该 书 首先 从 方法 论 角 度 展开 ， 指 出 研究 实践 中 最 常用 的 常规 回归 模型 在 处 
理 多 层次 关系 时 的 无 效 性 。 然 后 介绍 了 分 层 线 性 模型 的 原理 ， 讨 论 了 该 模型 在 
多 种 典型 情况 下 的 应 用 ， 并 附 以 许多 例题 的 分 析 示范 ， 十 分 解渴 。 显 然 ， 此 书 
的 宗 绷 并 不 赂 于 证 明 一 个 新 方法 ， 而 是 考虑 了 能 够 为 更 多 的 研究 人 员 和 学 生 所 
理解 ， 以 促进 该 方法 的 普及 应 用 。 事 实 上 ， 该 书 作 者 同时 也 是 同名 的 专门 统计 
软件 HLM 的 研制 者 。 

我 于 2001 年 开始 组 织 一 些 教师 和 博士 研究 生 一 起 分 工 翻译 该 书 。2002 
年 ，Raudenbush 教授 与 Bryk 教授 又 出 版 了 此 书 的 第 2 版 。 其 内 容 大 大 扩展 ， 
从 原来 的 10 章 扩展 为 14 章 ， 从 原来 的 260 页 扩展 为 480 页 ， 以 充分 反映 这 一 
方法 10 年 来 的 新 拓展 。 我 们 随即 决定 中 止 第 1 版 的 翻译 ， 改 为 翻译 第 2 版 。 
本 来 我 们 翻译 此 书 的 目的 共 是 团结 一 批 有 志 于 最 化 研究 方法 的 青年 学 者 一 起 追 
踪 周 际 学 术 前 沿 ， 但 经 过 2 年 时 间 的 反复 校正 与 修改 ， 最 终 我 们 形成 了 格式 统 

、 详 法 一 致 、 图 表 俱 全 的 详 稿 . 
北京 大 学 社会 学 系 马 成 教授 等 同仁 见 到 这 个 译本 后 ， 一 臻 鼓励 我 们 应 当 争 
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取 正 式 出 版 ， 并 且 还 为 此 事 多 方 联系 。 但 是 出 于 各 种 原因 ， 正 式 出 版 之 事 一 再 
受挫 。 最 后 ， 在 社会 科学 文献 出 版 社 社 长 谢 寿 光 教 授 的 颇 力 支持 下 ， 这 本 译 著 
才 得 以 正式 出 版 。 

本 书 的 翻译 采用 团队 工作 形式 ， 由 郭志 刚 (第 1、2、8、10、12 章 )、 郑 
AM (第 11 章 ) 、 陈 卫 OSH), AAR (第 6、7、14 章 ) 、 李 强 (第 3、4 
R), BAE (第 13 章 ) 、 张 笑 (第 9 章 ) 共同 承担 ， 最 后 由 郭志 刚 负责 全 书 
的 统 稿 和 校对 。 我 的 研究 生 焉 锡 炜 、 赵 联 飞 、 李 害 、 王 军 协助 进行 最 后 的 清 样 
校对 工作 。 

感谢 杨 桂 风 编 辑 高 度 认真 负责 的 精神 ， 她 的 辛勤 努力 使 这 一 中 文 版 增强 了 
文本 的 一 致 性 ， 并 提高 了 语言 上 的 易 读 性 。 

册 于 译 者 水 平 有 限 ， 对 此 学 术 前 沿 巨 著 的 理解 和 翻译 难免 有 不 当 之 处 ， 奶 
请 读者 指教 。 


郭志 刚 
于 海淀 蓝 旗 营 
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分 层 数 据 结构 : 一 个 常见 现象 


很 多 社会 研究 都 要 涉及 分 层 数 据 结 构 。 在 组 织 研 究 中 ， 需 槛 研究 工作 场所 
的 特征 ， 诸 如 决策 的 集中 度 ， 如 何 影响 的 工人 的 生产 率 。 其 中 ， 工 人 与 公司 都 
是 分 析 单 位 ; 变量 是 在 两 个 层次 进行 测量 的 。 这 样 的 数据 便 具 有 分 层 结构 ， 即 
[人 是 从 属于 公司 的 。 

在 多 国 研究 中 . 人 口 学 家 检查 不 同 国家 的 经 济 发 展 是 如 何 与 成 年 人 教育 程 
度 互动 并 影响 生育 率 的 ( 参见 Mason, Wong, and Entwistle，1983)。 这 样 的 研 
究 既 包括 在 国家 层次 测量 的 经 济 指标 ， 又 包括 以 住户 为 单位 的 教育 与 生育 信 
息 。 住 户 与 国家 都 是 研究 单位 ， 其 中 住户 是 从 属于 国家 的 ， 因 此 其 基本 数据 结 
构 也 是 分 层 的 。 

类 似 的 数据 形式 也 存在 于 成 长 研究 中 ， 其 数据 的 收集 往往 是 对 同一 组 个 体 
在 不 同时 点 做 多 次 的 观察 。 这 种 重复 测量 包含 了 每 一 个 体 成 长 的 轨迹 信息 。 心 
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理学 家 特别 感 兴趣 的 是 一 个 人 的 个 性 及 其 所 处 的 不 同 环境 如 何 影响 他 的 成 长 。 
比如 ，Huttenlocher、Haight、Bryk 和 Seltzer (1991) 研究 了 不 同 的 家 庭 语言 环 
境 对 儿童 在 成 长 过 程 中 掌 担 词汇 量 的 影响 。 当 样本 中 每 一 个 体 均 是 按 相同 时 点 
被 不 断 进 行 观 察 时 ， 通 常 将 其 视 为 一 种 不 同 个 体 与 不 同时 点 的 交互 研究 设计 。 
但 是 当 对 不 同 个 体 的 观察 在 时 点 的 数量 和 间隔 上 有 所 不 同时 ， 我 们 可 以 将 重复 
观察 视 为 坊 套 于 同一 个 体 的 不 同 场合 。 

许多 不 同 的 研究 发 现 的 量化 综合 显示 出 另 一 种 分 层 数据 问题 。 研 究 人 员 也 
许 想 探索 在 不 同 研究 中 十 涉 措施 、 研 究 方 法 、 对 象 特征 、 所 处 条 件 的 差别 是 如 
何 与 其 相应 的 干涉 效果 估计 相 联 系 的 。 在 这 种 情况 下 ， 对 象 嵌 套 于 不 同 的 研 
究 。 分 层 模型 也 为 这 类 研究 活动 提供 了 一 个 十 分 一 般 化 的 统计 框架 (Berkey et 
al. , 1995; Morris & Normand, 1992; Raudenbush and Bryk, 1985) 。 

教育 研究 尤其 具有 挑战 性 ， 因 为 学 生成 长 的 研究 总 是 涉及 在 结构 上 从 属于 
个 体 的 重复 观察 ， 并 且 每 一 个 体 义 从 属于 某 一 组 织 结构 。 比 如 ， 教 学 研究 专注 
于 学 生 与 某 一 老师 围绕 某 一 内 容 教 学 时 的 互动 。 这 种 互动 通常 发 生 于 班级 环境 
中 ， 并 且 以 某 一 学 期 为 界限 。 那 么 研究 问题 便 存在 三 个 焦点 : 学 生 个 体 在 一 学 
第 (或 其 中 的 某 一 段 ) 课程 学 习 中 的 成 长 ， 教 学 对 学 生 个 人 性 格 和 学 习 收 获 
上 的 效果 ， 以 及 上 述 联系 又 如 何 受 到 班级 设置 和 教师 行为 与 特征 的 影响 。 与 此 
对 应 ， 数 据 具 有 三 个 层次 的 结构 : 第 一 层 的 单位 是 各 时 点 的 重复 观察 ， 它 从 属于 
第 二 层 单位 中 的 每 一 学 生 ， 而 每 一 学 生 又 从 属于 第 三 层 单位 中 的 班组 或 学 校 。 

横向 研究 也 经 常 包含 三 个 层次 。 比 如 ，Nye、Hedges 和 Konstantopoulos 
(2000) 重新 分 析 了 田纳西 班组 规模 试验 的 数据 ， 这 个 试验 涉及 不 同学 校 所 包 
含 的 班组 中 的 学 生 。Raudenbush 、Cheong 和 Fotiu (1999) 分 析 了 美国 全 国教 
育 发 展 评价 的 数据 ， 其 中 涉及 各 州 的 学 校 的 学 生 - 


分 层 数据 分 析 中 持续 的 两 难 问题 


虽然 分 层 数据 结构 在 行为 科学 和 社会 研究 中 普遍 存在 ， 但 是 以 往 的 研究 常 
常 不 能 将 其 充分 地 体现 于 数据 分 析 之 中 。 在 很 大 程度 上 ， 这 种 忽略 反映 的 是 党 
规 线性 模型 统计 技术 在 分 析 绕 套 结构 上 的 局 限 性 。 在 社会 研究 中 ， 这 种 局 限 性 
产生 了 一 系列 的 问题 ， 如 汇总 偏差 、 估 计 精 度 误 差 以 及 “分 析 单 位 ”问题 
(参见 第 5 章 ) 。 这 些 问题 还 导致 了 概念 上 的 混乱 ， 阻 碍 了 在 分 析 模型 中 将 分 
层 结构 明确 化 ， 因 而 不 能 检验 在 每 个 不 同 层次 上 的 效应 ， 也 不 能 检验 各 种 层次 
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之 间 的 关系 。 与 此 类 似 ， 人 类 发 展 研究 也 受到 “变化 测量 ”问题 的 阻碍 ( 参 
见 第 6 章 ) ， 这 一 问题 经 常 显得 难以 处 理 ， 甚 至 导致 一 些 分 析 得 出 了 反对 直接 
建立 成 长 模型 的 结论 

尽管 分 析 单 位 问题 和 变化 测量 问题 在 文献 中 一 直 都 有 明确 的 、 互 不 重 释 的 
讨论 ， 但 其 实 它 们 有 着 共同 的 原因 ， 即 传统 统计 技术 无 力 分 析 分 层 模 型 。 历 史 
表明 ， 成 熟 的 分 析 对 于 某 一 具体 情况 总 是 能 够 找到 处 理 方法 ， 至 少 可 以 部 分 地 
解决 问题 。 随 着 近年 来 分 层 线性 模型 统计 理论 的 发 展 ， 一 套 完整 的 方法 已 经 建 
立 起 来 ， 可 以 广泛 应 用 ， 得 到 有 效 的 估计 。 

从 我 们 的 角度 而 言 ， 更 重 区 的 是 过 去 建构 分 层 模型 的 障碍 现在 已 经 被 破除 
了 ,我 们 现在 能 够 建立 关于 各 层 内 关系 与 各 层 间 关 系 的 假设 ， 并 且 还 可 以 估计 
出 各 个 层次 上 的 变化 量 ， 从 实际 意义 的 角度 ， 分 层 线性 模型 更 加 接近 于 行为 研 
究 和 社会 研究 中 的 基本 现象 。 它 们 不 仅 可 以 应 用 于 新 间 题 的 探索 ， 而 且 还 可 以 
提供 过 去 所 不 能 得 到 的 经 验 结 
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本 书 所 讨论 的 模型 在 不 同 领域 的 文献 中 有 不 同 的 称呼 。 在 社会 学 研究 中 ， 
它 经 常 被 称 为 多 层 线 性 模型 (multilevel linear models, Æ W, Goldstein, 1995; 
Mason et al. , 1983); 在 生物 统计 研究 中 更 经 常用 的 名 字 是 混合 效应 模型 
(mixed-effects models) 和 随机 效应 模型 ( random-effects models， 参 见 Elston 
and Grizzle, 1962; Laird and Ware, 1982; Singer, 1998); 计量 经 济 学 文献 称 之 
为 随机 系数 回归 模型 ( random-coefficient regression models, # H, Rosenberg, 
1973; Longford, 1993); 统计 学 文献 则 称 之 为 协 方差 成 分 模型 (covariance com- 
ponents models, # Dempster, Rubin, and Tsutakawa, 1981; Longford, 1987) 。 

我 们 采用 分 层 线性 模型 (hierarchical linear models) 的 称谓 ， 因 为 它 指 出 
了 即使 在 不 同 应 用 中 ， 比 如 成 长 研究 、 组 织 效应 、 综 合 研 究 ， 其 数据 都 存在 一 
个 相同 的 重要 结构 特征 。 这 一 称呼 最 早 由 Lindley 和 Smith (1972) 提出 ， 作 为 
他 们 对 线性 模型 的 贝 叶 斯 估计 方面 所 做 贡献 的 一 部 分 。 在 这 一 方面 ， 他 们 为 具 
有 复杂 误差 结构 的 才 套 数据 研制 了 一 个 通用 的 研究 框架 。 

WRH, Lindley 和 Smith (1972) 的 研究 在 一 段 时 间 中 停滞 不 前 ， 因 为 
其 模型 应 用 需要 对 非 平衡 数据 进行 协 方差 成 分 估计 。 在 1970 年 代 早期 ， 他 们 
的 模型 只 能 解决 一 些 极 简单 的 问题 ， 提 供 一 个 通用 的 估计 方法 尚 不 可 能 。 后 
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Æ, Dempster, Laird 和 Rubin (1977) 在 EM 算法 上 的 进展 突破 了 这 一 技 术 障 
碍 ， 撒 成 了 概念 上 切实 可 行 又 可 以 广泛 应 用 的 协 方 差 成 分 估计 方法 。Dempster 
等 人 (1981) 示范 了 这 种 方法 对 分 层 数 据 结构 的 适用 性 。Laird 和 Ware 
(1982) ， 以 及 Strenio、Weisberg 和 Bryk (1983) 都 是 应 用 这 一 技术 方法 解决 
了 横向 数据 (cross-sectional data) 中 多 层 结构 的 计算 问题 。 

后 来 ， 又 产生 了 其 他 通过 近代 再 加 权 的 一 般 最 小 二 乘法 的 协 方差 成 分 估计 
方法 (Goldstein, 1986) 和 Fisher 得 分 算法 ( Longford，1987) 。 现 在 已 经 有 好 
多 统计 计算 程序 来 拟 合 这 些 模型 ， 包 括 HLM (Raudenbush et al. , 2000) 、 
MIXOR ( Hedeker & Gibbons, 1996), MLWIN (Rasbash et al. , 2000), SAS 子 
程序 Proc Mixed (Little et al. , 1996), VARCL (Longford, 1988)。 完 全 贝 叶 斯 
方法 也 已 经 由 Gelfand FA (1990) 和 Seltzer (1993) 研制 出 来 ， 相 应 的 软件 
如 BUGS (Spiegelhalter et al. , 1994) 现在 也 得 到 了 广泛 应 用 。 


分 层 线性 模型 的 早期 应 用 


如 上 所 述 ， 行 为 科学 和 社会 科学 数据 常常 具有 嵌 套 结构 ， 比 如 ,包括 了 从 
属于 个 人 的 重复 观测 。 这 些 个 人 可 能 又 从 属于 某 种 组 织 单位 ， 比 如 学 校 。 而 组 
织 单位 本 身 又 可 能 从 属于 社区 ， 再 从 属于 州 ， 再 从 属于 国家 。 利 用 分 层 线性 模 
型 ， 这 一 结构 中 的 每 一 层次 都 用 子 模型 来 代表 。 这 些 子 模型 反映 了 本 层 变 量 之 
间 的 关系 ， 并 且 定义 了 某 一 层次 的 变量 对 另 一 层次 变量 之 间 的 关系 所 产生 的 影 
网 。 尽 管 不 论 有 多 少 个 层次 都 可 以 这 样 来 代表 ， 但 所 有 基本 统计 特征 可 以 通过 
-个 两 层 的 模型 反映 出 来 

本 书 所 讨论 的 应 用 问题 包括 三 个 方面 的 研究 用 途 : 一 是 如 何 对 个 体 单位 取 
得 较 好 的 效应 估计 (比如 通过 借助 其 他 学 校 也 有 类 似 估计 的 事实 来 改进 某 一 
个 学 校 的 回归 模型 ); 二 是 对 各 层次 之 间 的 效应 建立 模型 并 进行 假设 检验 ( 比 
如 学 校规 模 如 何 影响 学 生 的 社会 特征 与 学 校 的 教学 成 绩 之 间 的 关系 ); 三 是 分 
解 各 层次 间 的 方差 和 协 方差 成 分 ( 比如 将 学 生 层 次 的 变量 之 间 的 协 变 分 解 为 
校内 与 校 际 两 种 成 分 ) 。 代 表 每 一 类 型 的 已 发 表 的 范例 将 在 下 面 加 以 概括 。 


个 体 效 应 的 改进 估计 


Braun, Jones, Rubin 和 Thayer (1983) 关注 的 问题 是 工商 学 校 在 研究 生 





录取 中 使 用 标准 化 考试 分 来 选取 少数 民族 申请 者 。 许 多 学 校 的 录取 决策 都 部 分 
地 取决 于 用 考试 成 绩 来 预测 以 后 学 业 成 绩 的 公式 。 然 而 ， 由 于 大 多 数学 校 所 录 
取 的 大 多 数学 生 都 是 白人 ， 所 以 白人 学 生 的 数据 主宰 了 预测 公式 的 估计 。 结 
果 ， 这些 公式 可 能 在 选择 少数 民族 学 生 时 并 不 能 提供 合理 的 排序 。 

原则 上 ， 更 为 公正 的 是 每 个 学 校 应 该 建立 一 个 选择 少数 民族 学 生 的 公式 ， 
但 是 在 估计 这 一 公式 时 会 产生 困难 ， 因 为 大 多 数学 校 只 有 几 个 少数 民族 学 生 ， 
而 数据 太 少 不 能 建立 可 靠 的 预测 公式 。Braun 等 人 (1983) 使 用 的 是 59 个 工 
高 管理 学 校 的 研究 生 数据 ， 其 中 有 14 个 学 校 根本 没有 少数 民族 学 生 ， 有 20 个 
学 校 的 少数 民族 学 生 的 人 数 在 1 ~3 人 之 间 。 这 些 学 校 便 不 可 能 应 用 标准 回归 
方法 来 建立 少数 民族 学 生 的 预测 公式 。 此 外 ， 即 使 是 对 于 有 较 多 少数 民族 学 生 
的 其 他 25 个 学 校 而 言 ， 虽 然 可 以 建立 估计 模型 ， 但 少数 民族 学 生 的 样本 量 还 
是 太 少 ， 因 此 其 估计 系数 精度 会 很 差 。 

如 果 换 用 另 一 种 方法 ， 可 以 不 管 学 生 属 于 哪个 学 校 ， 将 所 有 学 校 的 样本 汇 
集 在 一 起 。 但 这 种 方法 也 会 产生 问题 。 当 某 些 学 校 的 少数 民族 学 生 较 多 而 另 一 
些 学 校 的 少数 民族 学 生 很 少时 ， 由 于 公式 不 能 反映 这 种 选 搓 性 现象 ， 因 而 导致 
预测 系数 的 估计 偏差 。 

Braun $A (1983) 采用 了 分 层 线性 模型 来 解决 这 一 两 难 问 题 。 通 过 汇集 
所 有 数据 ， 他 们 得 以 有 效 利 用 所 有 信息 为 每 个 学 校 提供 一 个 能 区 分 白人 学 生 和 
少数 民族 学 生 的 模型 。 每 个 学 校 的 预测 值 实际 上 是 这 一 学 校 的 各 项 信息 与 所 有 
样本 之 中 的 变量 关系 的 加 权 组 合 。 正 如 人 们 所 期 望 的 ， 这 些 对 每 一 成 分 的 相对 
权 数 依赖 于 它们 的 精度 。 这 一 估计 程序 将 在 第 3 章 加 以 描述 ， 在 第 4 章 给 予 示 
范 。 有 关 的 应 用 还 可 以 参见 Rubin (1980) 的 论文 ， 这 些 统计 发 展 的 回顾 可 以 
参见 Morris (1983) 的 论文 


对 层次 之 间 效 应 的 建 模 


分 层 模型 的 第 一 种 用 途 关系 到 用 模型 来 反映 在 某 一 层次 测量 的 变量 如 何 影 
响 其 他 层次 变量 之 间 的 关系 ， 并 且 对 相应 假设 进行 检验 。 由 于 这 种 层次 间 的 效 
应 在 行为 科学 和 社会 研究 中 十 分 普通 ， 因 此 分 层 模型 的 框架 比 传统 方法 有 明显 
的 优越 性 。 

社会 研究 的 一 个 例证 。Mason 等 人 (1983) 检查 了 15 个 国家 中 母亲 的 教 
育 程度 和 城乡 居住 类 型 对 其 生育 率 的 影响 。 大 家 都 知道 ， 在 许多 国家 ， 教 育 程 
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度 高 和 城市 化 水 平 高 会 导致 生育 率 较 低 。 然 而 ， 研 究 者 提出 的 问题 是 ， 这 样 一 
种 影响 也 许 依赖 于 各 个 国家 的 特征 ， 包 括 以 国民 生产 总 值 (GNP) 所 测量 的 国 
家 经 济 发 展 状况 和 计划 生育 工作 的 强度 。 

Mason 等 人 发 现 ， 在 所 有 的 国家 中 ， 母 亲 教 育 程度 较 高 的 确 与 较 低 的 生育 
率 相 联 系 。 但是， 城乡 生育 率 的 差别 在 各 国之 间 有 所 不 同 ， 处 于 差别 两 极 的 情 
况 是 国民 生产 总 值 很 高 的 国家 和 几乎 没有 组 织 化 计划 生育 工作 的 国家 。 有 关 差 
别 效应 (differentiating effects) 的 识别 ， 比如 城乡 差距 的 识别 ， 以 及 它们 变化 
的 预测 ， 将 在 第 5 章 加 以 讨论 。 

发 展 研究 的 一 个 例证 。 语 言 能 力 发 展 研究 假设 个 人 词汇 的 获取 取决 于 两 个 
Fi: 一 是 适当 的 语言 环境 ， 二 是 从 环境 中 学 习 的 先天 能 力 。 人 们 普遍 认为 ， 
儿童 词汇 发 展 上 的 差别 主要 是 由 先天 能 力 上 的 差别 决定 的 。 然 而 ， 经 验 研究 结 
果 并 不 太 支 持 这 种 假设 。 遗 传 可 能 性 研究 发 现 ， 父 母 的 标准 化 词汇 油 试 得 分 只 
能 解释 子女 在 该 测试 得 分 差别 中 的 10% ~ 20% 。 语 言 环境 研究 的 结果 也 好 不 
了 多 少 ， 大 部 分 个 人 词汇 获取 上 的 差别 仍然 无 法 得 到 解释 。 

过 去 ,研究 者 们 主要 采用 两 时 点 设计 来 研究 语言 环境 效应 。 比 如 ， 先 在 
14 个 月 大 时 检测 婴儿 的 词汇 量 , 同时 取得 母亲 的 语言 能 力 或 整体 语言 能 力 。 
然后 间隔 一 段 时 间 后 ， 比 如 在 婴儿 26 个 月 太 的 时 候 ， 再 次 检测 婴儿 的 词汇 量 。 
这 些 数据 是 采用 常规 线性 模型 进行 分 析 的 ， 其 研究 焦点 是 ， 在 控制 婴儿 的 
“初始 能 力 ”( 即 14 个 月 时 掌握 的 词汇 量 ) 的 条 件 下 ， 看 母亲 的 语言 能 力 对 其 
26 个 月 大 的 机 儿 的 词汇 量 的 影响 。 

Huttenlocher 等 人 (1991) 收集 了 一 些 关于 儿童 的 历时 数据 ， 在 其 年 龄 为 
14 个 月 至 26 个 月 期 间 进行 观测 ， 观 测 最 多 的 达到 了 7 次 。 这 一 数据 可 以 用 每 
个 孩子 的 历时 重复 检测 值 对 其 个 人 词汇 量 的 发 展 轨迹 建立 模型 。 每 个 孩子 的 成 
长 由 一 套 参 数 来 反映 。 第 二 个 模型 应 用 了 关于 这 个 孩子 的 其 他 信息 ,包括 孩 子 
的 性 别 、 和 母亲 在 家 中 的 说 话 量 ,来 预测 孩子 词汇 量 的 增长 参数 。 有 关 这 一 模型 
的 实际 建 模 与 估计 将 在 第 6 章 中 详细 讨论 。 

这 一 分 析 应 用 了 分 层 线 性 模 弄 ， 最 后 揭示 出 ， 语 言 环境 在 历 幼 儿 期 词汇 
量 增长 中 的 作用 远 比 以 往 研究 所 报告 的 水 平 要 大 得 多 。( 实 际 上 ， 如 果 对 比 
原来 仅 用 两 时 点 检测 值 的 常规 方法 分 析 结果 ， 所 显示 的 差异 还 要 更 大 。) 这 
一 应 用 研究 揭示 了 常规 方法 在 成 长 与 其 相关 因素 关联 研究 方面 的 有 效 性 
很 差 。 
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分 解 方 差 协 方差 成 分 


分 层 线性 模型 的 第 三 种 用 途 是 对 非 平衡 炭 套 数据 中 的 方差 协 方差 成 分 进行 
分 解 估 计 。 比 如 ， 教 育 研究 常常 分 析 学 生 个 体 在 不 同 的 班组 和 学 校 的 组 织 设置 
条 件 下 的 成 长 过 程 。 对 这 一 现象 建立 规范 化 模型 需要 包括 三 个 层次 。 

Bryk 和 Raudenbush (1988) 使 用 持续 效应 研究 (Carter, 1984) 的 历时 数 
据 的 一 部 分 样本 来 示范 这 一 方法 - 这 一 数据 包含 86 个 学 校 中 的 618 名 学 生 在 
一 年 级 至 三 年 级 期 间 所 进行 的 5 次 数学 考试 成 绩 。 首先 ， 他 们 对 各 学 校 的 每 个 
该 子 建立 个 体 学 业 成 绩 的 增长 (或 重复 测量 值 ) 模型 。 三 层次 方法 使 这 些 个 
体 成 长 轨迹 的 差别 得 以 分 解 为 学 校内 部 的 差别 成 分 和 学 校 之 间 的 差别 成 分 。 这 
一 应 用 研究 的 细节 将 在 第 8 章 中 进行 讨论 。 

该 研究 的 结果 令 人 惊讶 ， 增 长 率 中 83% 的 方差 反映 的 是 学 校 之 间 的 差别 。 
与 此 相 比 ， 只 有 大 约 14% 的 增长 方差 反映 的 是 学 校 之 间 在 学 生 进 校 时 水 平 上 
的 差别 ， 这 种 结果 与 关于 学 校 影响 的 横向 研究 的 典型 结果 是 一 致 的 。 这 一 分 析 
说 明 ， 学 校 之 间 的 差别 非常 大 ， 然 而 常规 模型 却 检测 不 出 来 ， 因 为 常规 模型 没 
有 包含 将 学 习 指标 进行 校内 差别 成 分 与 校 际 差别 成 分 的 分 解 。 


本 书 第 1 版 问世 以 来 的 新 发 展 


随 着 对 分 层 模型 的 兴趣 的 增长 ， 方 法 上 的 创新 也 日 益 加 速 ， 社 会 科学 和 医 
学 方面 都 产生 了 许多 富有 创造 性 的 应 用 。 第 一 ， 模 型 所 采用 的 结果 变量 已 经 扩 
展 了 范围 ; 第 二 ,模型 现在 不 仅 可 以 包括 纯粹 的 嵌 套 数据 结构 ， 而 且 还 可 以 包 
括 交 互 分 类 的 数据 结构 ; 第 三 ， 结 果 的 多 元 影响 问题 的 应 用 已 经 成 为 主流 ; 第 
四 ,潜在 变节 已 经 被 植 入 分 层 模型 ; 第 五 ， 对 分 层 模型 的 贝 叶 斯 推断 获得 了 更 
广泛 的 普及 和 应 用 。 这 些 新 发 展 再 与 现在 大 大 提高 的 计算 能 力 结合 起 来 ， 使 得 
这 种 模型 的 扩展 引发 了 整个 系列 的 新 应 用 。 


结果 变量 范围 的 扩展 


本 书 的 第 1 版 仅 将 其 关注 限于 连续 型 分 布 的 层 - 1 结果 。 对 于 这 种 类 型 的 
结果 ， 经常 可 以 有 理由 假定 模型 的 误差 是 正 态 分 布 的。 统计 推断 可 以 在 正 态 分 


10 分 层 线性 模型 ， 应 用 与 数据 分 析 方法 


布 理论 范围 内 进行 较 容易 的 运算 。 当 结果 属于 离散 型 变量 时 ， 推 断 便 更 为 复 
杂 。 突 出 的 例子 包括 二 分 类 的 结果 (如 就 业 与 失业 )， 计 数 数 据 (如 某 邻 里 小 
区 一 年 中 所 发 生 的 犯罪 例 数 ) ， 序 次 分 类 结果 (如 对 工作 的 低 、 中 、 高 的 满意 
度 )， 多 分 类 的 名 义 测 基 结果 (如 壮 工 、 职 员 、 服 务 人 员 、 专 业 人 员 等 职业 类 
型 ) 。 对 于 这 些 结果 ， 便 不 能 再 假定 层 -1 为 有 正 态 性 的 线性 模型 。 将 这 些 非 
正 态 的 结果 植 人 分 层 模型 使 适当 的 统计 和 计算 方法 的 研究 更 具有 挑战 性 。 

Stiratelli, Laird 和 Ware (1984) LAR Wong 和 Mason (1985) 是 通过 对 最 
大 似 然 估计 (ML) 做 一 阶 近似 来 解决 这 种 问题 的 最 早 的 一 批 探索 者 。Gold- 
stein (1991) 和 Longford (1993) 对 此 研制 了 软件 ， 可 以 使 模型 应 用 于 不 同类 
型 的 离散 型 结果 ， 也 可 以 分 析 两 层 和 三 层 的 模型 。 然 而 ，Breslow 和 Clayton 
(1993) 以 及 German 和 Rodriquez (1995) 却说 明 这 种 近似 法 在 某 些 条 件 下 可 
能 很 不 准确 。Goldstein (1995) 曾 研制 过 一 种 二 阶 近似 法 。Hedeker 和 Gibbons 
(1993) 以 及 Pinheiro 和 Bates (1995) 研制 了 用 高 斯 - 赫 米 特 积 分 对 最 大 似 然 
值 的 准确 的 近似 计算 法 ， 这 些 方法 现在 被 Mixor 软件 和 SAS Froc Mixed 软件 所 
应 用 。 另 一 种 很 准确 上 且 计 算 方 使 的 近似 方法 采用 了 高 阶 拉 普 拉 斯 转换 (Rau- 
denbush, Yang, & Yəsef, 2000), ， 这 种 近似 法 被 应 用 于 HLM 软件 。 

作为 这 些 统计 和 计算 创新 的 结果 ， 已 经 可 以 应 用 分 层 模 型 的 原理 来 处 理 很 
多 种 不 同类 型 的 结果 变量 了 。Rumberger (1995) 用 两 层 模型 研究 了 学 生 退 学 
情况 的 自 变量 ， 确 定 了 一 系列 影响 早期 退学 情况 的 学 生 层次 和 学 校 层次 的 风险 
因素 。 层 -1 模型 是 logistic 回归 ， 其 中 早期 退学 的 对 数 发 生 比 依赖 于 学 生 的 背 
景 特 征 。 层 -1 系数 作为 学 校 特 征 的 函数 在 不 同学 校 之 间 存 在 变异 。Horney、 
Osgood 和 Marshall (1995) 提供 了 一 个 很 有 意思 的 重复 测量 研究 ， 其 目的 是 研 
究 攻 击 性 倾向 较 高 的 人 实际 犯罪 情况 是 否 随 所 处 生活 环境 如 就 业 和 婚姻 状况 而 
发 生变 化 。 其 结果 是 二 分 类 的 ， 即 每 个 研究 对 象 在 前 一 个 月 中 是 否 发 生 过 犯 
罪 。 一 些 解 释 变 量 还 可 以 随时 间 变 化 〈 比 如 就 业 或 失业 ) ， 另 外 一 些 解释 变量 
在 对 象 之 间 存 在 差异 但 并 不 涉及 时 间 变 化 。 层 - ! 模型 是 解释 个 人 在 犯罪 的 对 
数 发 生 比 变化 的 logistic 回归 模型 。 个 人 变化 的 参数 又 在 层 - 2 存在 变异 。 
Sampson, Raudenbush 和 Earls (1997) 曾 提 供 了 以 计数 数据 作为 结果 (各 邻里 
小 区 的 杀人 案 数量 ) 的 例子 ， 而 Reardon 和 Buka (正在 出 版 中 ) 则 用 生存 模 
型 来 研究 不 同 邻里 小 区 中 年 轻 人 开始 抽烟 的 年 龄 。 

第 10 章 讨论 分 层 模 型 在 二 分 类 结果 、 计 数 数据 、 序 次 分 类 以 及 多 名 义 分 
类 结果 时 的 应 用 。 
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4g 
Di 


与 交互 分 类 数据 结构 的 结合 


本 书 第 1 版 的 所 有 例子 都 是 “纯粹 ”分 层 的 。 比 如 ， 当 学 生 骨 套 于 班组 ， 
青岩 父 于 学 校 时 ， 我 们 有 理由 假定 每 个 学 生 属 于 一 个 班组 ， 且 仅仅 属于 一 个 班 
组 ; 而 每 一 个 班组 属于 一 个 学 校 ， 且 仅仅 属于 一 个 学 校 。 然 而 ， 撤 套 结 构 经 常 
更 为 复杂 。 比 如 .学生 可 以 就 学 于 不 同学 校 ， 而 又 居住 于 不 同 的 社区 。 这 种 数 
据 并 不 是 纯粹 分 层 形式 ， 因 为 一 个 学 校 接受 的 学 生来 自 许多 社区 ， 而 同一 个 社 
区 中 的 孩子 在 许多 所 不 同 的 学 校 中 上 学 :我们 将 学 生 视 为 按 社 区 和 学 校 的 交互 
分 类 、Raudenbush (1993) 对 这 类 情况 研究 出 -种 方法 。 层 -1 模型 描述 学 生 
层次 自 宰 基 与 由 社区 和 学 校 交 互 分 类 定义 的 “单元 ”结果 之 间 的 联系 。 这 一 
模型 的 系数 可 以 存在 社 区 和 学 校 差异 。 我 们 感 兴趣 的 是 社区 层次 和 学 校 层次 有 
哪些 自 变 世 ， 以 及 社区 和 党校 层 次 特征 之 间 的 双 央 素 互动 情况 。 第 二 个 例子 涉 
及 对 学 生 就 学 的 小 学 与 中 学 的 交互 分 类 (Goldstein, 1995) 。 

交互 分 类 还 存在 于 重复 测量 数据 中 . 在 第 12 章 ， 我 们 讨论 在 小 学 期 间 数 
学 知识 的 增长 。 每 一 年 学 生 都 会 加 入 一 个 新 的 班组 。 从 原理 上 ， 在 这 个 班组 的 
经 验 会 导致 学 生 的 增长 曲线 发 生 正方 向 或 负 方向 的 “偏转 " 。 这 些 偏 转 的 方差 
使 是 班组 的 方差 。 这 种 数据 涉及 按 学 生 和 班组 交互 分 类 的 重复 观测 。 在 不 同 特 
定 假 设 之 下 ， 增 长 曲线 方面 的 部 分 偏差 既 可 以 显示 为 是 与 学 生 个 体 之 间 的 差别 
相 联系 的 ， 也 可 以 显示 为 是 与 教师 教学 效果 差别 相 联系 的 。 在 研究 中 考虑 到 班 
组 的 效应 还 能 够 减少 学 生 数 学 知识 结果 估计 的 时 间 上 的 不 稳定 性 。 

第 12 章 介绍 了 交互 分 类 的 随机 效应 模型 ， 并 对 几 个 例子 做 了 应 用 研究 
示范 


多 元 模型 


本 书 的 第 1 版 只 考虑 了 层 -1 结果 只 受 单个 自 变量 影响 。 自 那 时 以 来 ， 对 
多 元 影响 结果 的 分 层 模型 应 用 已 经 越 来 越 普遍 。 也 许 最 突出 的 应 用 涉及 重复 测 
莽 数据 。 设想 一 个 历时 研究 对 每 个 对 象 采用 轿 定 的 数据 收集 方法 ， 即 研究 计划 
对 每 个 对 象 在 一 系列 相同 的 时 点 上 采集 数据 。 如 果 不 存在 数据 缺失 ， 这 种 设计 
将 得 到 一 套 平 衡 数据 : 每 个 人 的 测 其 次 数 都 是 相同 的 ， 并 且 测 量 之 间 的 时 间 间 
了 晴 也 是 相同 的 。 在 这 种 情况 下 ， 可 以 采用 多 元 重复 测量 的 经 典 模型 。 这 些 方法 
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可 能 产生 对 时 间 序 列 数据 的 一 系列 方差 协 方差 分 析 模 型 ， 可 以 包括 自 相关 误差 
和 随机 变化 的 斜率 ， 也 可 以 是 非 限定 模型 ， 即 对 每 时 点 都 有 一 个 独特 的 方差 ， 
在 每 一 对 时 点 之 间 有 独特 的 协 方差 。Jennrich 和 Schluchter (1986) 最 早 提出 
了 解决 问题 的 方法 及 其 软件 ， 这 些 方法 甚至 在 存在 时 点 缺失 时 也 可 以 应 用 。 
Goldstein (1995) 将 这 种 思路 结合 到 分 层 模型 里 来 。SAS (1996) 在 其 程序 
Proc Mixed 中 运用 了 类 似 的 方法 ， 后 来 Hedeker 和 Gibbons (1996) 在 软件 
Mixor， 以 及 Raudenbush 等 人 (2000) 在 HLM 软件 中 也 是 这 么 做 的 。 第 2 版 
将 在 第 6 章 讨 论 多 元 的 增长 模型 ， 同 时 还 提供 了 与 单 变量 结果 的 标准 分 层 模型 
结果 的 比较 ， 同时， 第 6 章 还 将 这 种 方法 进行 了 扩展 ， 即 重复 测量 的 对 象 还 霸 
套 于 不 同 的 组 织 。 


潜在 变量 模型 


在 数据 缺失 问题 中 ， 第 二 种 多 元 结果 模型 便 极为 有 用 了 。 采 用 一 种 变形 的 
Jennrich 和 Schluchter 方法 (1986), ， 可 以 从 不 完整 数据 中 估计 一 套 连 续 变 量 的 
联合 分 布 。 这 使 得 一 种 可 以 在 自 变 量 随机 缺失 时 的 回归 估计 方法 成 为 可 能 。 所 
谓 的 “完整 数据 ” 指 观 测 数据 加 上 非 观 测 的 潜在 变量 。 观 测 的 不 完整 的 数据 
被 用 来 估计 这 些 潜在 变量 之 间 的 联系 (参见 Little & Rubin, 1987; Little & 
Schenker，1995 ) 。 这 种 方法 采用 了 一 种 类 似 的 策略 来 计算 多 元 回归 模型 中 自 变 
量 的 测量 误差 。 第 一 层 分 层 模型 代表 了 存在 测量 误差 的 观测 数据 与 潜在 的 
“真实 ”数据 之 间 的 联系 ， 这 种 方法 还 精致 地 扩展 到 分 组 (比如 学 校 或 社区 ) 
的 特征 变量 存在 测量 误差 的 情况 。 另 一 种 自然 的 扩展 是 在 分 层 模型 中 估计 存在 
测量 误差 的 自 变量 的 直接 效应 和 间接 效应 。 这 些 论题 将 在 第 11 章 中 介绍 。 

分 项 反应 (item response) 模型 早 就 在 教育 的 测验 中 应 用 了 ， 现 在 又 逐渐 
地 应 用 于 其 他 社会 科学 领域 中 。 这 种 模型 将 某 种 反应 表示 为 概率 ， 它 是 分 项 特 
征 与 菜 和 人 的 “能 力 ” 或 “潜在 特性 ”的 函数 。 个 人 特性 是 所 关注 的 潜在 变量 。 
这 样 一 种 模型 可 以 表示 为 两 层 模型 ， 其 中 分 项 反应 嵌 套 于 个 人 。 第 11 章 还 示 
范 了 如 何 设置 这 种 模型 ， 以 及 如 何 再 扩展 到 结合 将 个 人 赃 套 于 分 组 。 


贝 叶 斯 推断 


在 本 书 的 第 1 版 中 ， 所 有 的 统计 推断 都 基于 最 大 似 然 法 (ML) 。 最 大 似 然 


18 寺 13 


法 有 许多 好 的 性 质 ， 参数 估计 具有 一 致 性 ， 并 且 是 渐 近 无 偏 和 有 效 的 。 这 些 估 
计 有 大 样本 的 正 态 分 布 ， 模 型 比较 的 统计 检验 也 是 现成 的 。 然而， 这 些 好 的 性 
质 全 都 基于 大 样本 理论 之 上 。 在 分 层 模型 的 情况 下 ， 处 于 高 层 的 单位 数 (如 
两 层 模型 中 层 -2 单位 的 数量 ) 总 是 决定 是 否 可 应 用 这 些 大 样本 性 质 的 关键 。 
实际 上 ， 要 是 最 高 一 层 的 样本 规模 很 小 时 ， 推 断 统计 便 可 能 不 可 靠 ， 这 取决 于 
数据 不 于 衡 的 程度 和 所 求 推断 的 具体 类 型 。 

在 这 些 情况 下 ， 贝 叶 斯 方法 是 -种 明智 的 替换 方法 。 其 标准 误 将 比 最 大 似 
然 法 计算 的 标准 误 更 接近 于 实际 情况 。 此 外 ， 通 过 提供 所 关注 的 每 一 参数 的 后 
验 分 布 ， 贝 叶 斯 方法 还 可 以 对 研究 问题 做 出 多 种 有 意思 的 图 示 和 量化 的 概括 。 

贝 叶 斯 方法 并 不 是 一 个 新 方法 。 真 正 新 的 是 其 有 了 便利 的 计算 方法 ， 尤 其 
是 对 于 分 层 数 据 及 分 层 模型 。 这 些 新 方法 中 所 含 的 发 展 涉及 一 系列 采用 蒙特 卡 
罗 方 法 对 所 设置 的 后 验 分 布 的 近似 算法 ， 而 这 些 估计 在 过 去 被 认为 是 难以 对 付 
的 工作 。 这 些 方法 包括 数据 增 广 (Tanner & Wong, 1987) 和 吉 布 斯 抽样 (Gel- 
fand ef al. , 1990; Gelfand & Smith, 1990) 。 应 用 这 些 方法 的 软件 现在 也 能 够 得 
到 (Spiegelhalter et al. , 1996; Rasbash et al. ，2000) 。 一 个 很 有 意思 的 例子 是 
Selzer (1993) 对 原来 由 Huttenlocher 等 人 (1991) 发 表 的 词汇 量 数据 的 重新 
分 析 ， 本 书 的 第 1 版 也 曾 对 这 一 数据 做 过 研究 。 这 个 例子 涉及 22 个 幼儿 在 1 
岁 期 间 词汇 量 的 增长 。 最 大 似 然 推断 在 这 种 场合 存在 风险 ， 因 为 第 二 层 单位 
(幼儿 ) 的 数量 很 少 。 这 一 分析 得 到 了 层 - 1 系数 的 后 验 分 布 ， 最 引 人 注 意 的 
是 ， 还 取得 了 每 个 孩子 的 加 速度 ， 以 及 所 设置 的 母亲 的 语言 能 力 与 加 速度 之 间 
联系 的 关键 层 -2 系数 的 后 验 分 布 。 第 13 章 对 贝 叶 斯 推断 的 原理 进行 了 简单 
介绍 ， 并 用 分 层 数据 示范 了 它 的 应 用 。 


本 书 的 框架 结构 


本 书 组 织 为 四 个 主要 部 分 。 在 前 两 个 部 分 中 ， 第 一 部 分 是 “原理 "， 第 二 
部 分 是 “基本 应 用 " 。 这 两 个 部 分 共 由 9 章 内 容 组 成 ， 是 与 第 1 版 紧密 对 应 的 ， 
但 增加 了 许多 重要 扩展 和 技术 阐释 。 

我 们 在 第 6 章 增加 了 新 的 一 节 ， 即 多 元 增长 模型 。 在 第 二 部 分 增加 了 更 多 
的 示范 例题 ， 还 就 层 -1 自 变 量 的 对 中 操作 增加 了 进一步 分 析 建 议 。 我 们 还 介 
绍 了 一 些 新 的 统计 指标 ， 如 合理 值 区 间 (plausible value intervals) 和 稳健 标准 
误 (robust standard errors) ， 它 们 在 第 1 版 中 并 不 存在 。 
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第 三 部 分 “高 级 应 用 ”是 全 新 的 内 容 。 第 四 部 分 对 本 书 方法 和 计算 进行 
了 技术 上 的 讨论 。 

第 一 部 分 中 除了 本 章 之 外 ， 还 有 其 他 3 章 内 容 。 第 2 章 根据 回归 分 析 与 随 
机 效应 的 方差 分 析 来 建立 - 套 较为 简单 的 概念 ， 用 以 介绍 分 层 线 性 模型 的 原 
理 。 在 第 3 章 中 ,我 们 总 结 了 这 一 模型 中 有 关 估计 与 推断 的 基本 程序 ， 其 重点 
是 在 简要 的 数学 排 导 基 础 上 提供 更 为 直观 的 介绍 。 然 后， 第 4 章 对 这 些 程序 加 
以 示范 ， 采 用 同一 套数 据 ， 逐 步 建立 较为 复杂 的 估计 模型 。 

第 二 部 分 “基本 应 用 ”包括 5 章 内 容 。 第 5 章 和 第 6 章 分 别 讨论 在 组 织 效 
应 研究 与 个 体 成 长 研究 中 如 何 应 用 两 层 的 模型 。 第 7 章 讨论 在 综合 研究 或 元 分 
析 中 的 应 用 。 这 实际 上 代表 了 一 组 特殊 的 应 用 ， 其 中 第 一 层次 的 变化 是 已 知 
的 。 第 8 章 介 绍 三 层次 的 模型 ， 并 讨论 其 有 关 应 用 ， 包 括 用 教育 研究 的 一 个 关 
键 问题 来 作为 例证 ， 即 学 校 组 织 是 如 何 影响 学 生 学 习 过 程 的。 第 9 章 回顾 了 模 
型 的 基本 假定 条 件 ， 描 述 了 这 些 假定 条 件 有 效 性 的 检验 程序 ， 并 讨论 了 当 违 反 
这 些 假定 条 件 时 有 哪些 已 知 的 推断 间 题 及 其 敏感 性 。 

第 三 部 分 “高 级 应 用 ”由 4 章 内 容 构 成 。 第 10 章 介绍 分 层 模型 在 离散 结 
果 时 的 应 用 。 它 考虑 了 一 分 类 结果 、 计 数 结果 、 序 次 分 类 结果 以 及 多 类 名 义 结 
果 的 情况 。 对 每 一 种 情况 的 例子 都 提供 了 详细 讨论 ， 还 考虑 了 总 体 平均 模型 ， 
也 称 为 边际 模型 (Heagerty & Zeger, 2000) ， 及 其 与 具体 单位 模型 之 间 的 不 同 。 
第 11 章 考虑 了 潜在 变量 模型 。 所 关注 的 问题 包括 从 缺失 数据 做 回归 估计 ， 以 
及 在 自 变量 存在 测量 误差 时 的 回归 估计 ， 还 有 在 分 层 模型 框架 中 植 人 分 项 反应 
模型 。 第 12 章 介 绍 了 交互 分 类 的 随机 效应 模型 。 第 13 章 关 注 于 对 分 层 线性 模 
型 的 贝 叶 斯 推断 。 

第 四 部 分 提供 了 贯穿 本 书 的 统计 理论 和 计算 方法 。 它 考虑 了 层 - 1 的 具有 
正 态 误差 的 一 元 线性 模型 、 多 元 线性 模型 以 及 分 层 一 般 化 线性 模型 。 


分 层 线性 模型 的 原理 


© 初步 知识 

© 一 般 模型 及 其 简单 子 模型 
o 基本 分 层 线 性 模型 的 推广 
© REX fOW HR (AF) 
© 本 章 术 语 及 注释 的 概括 


本 章 介 绍 分 层 线性 模型 的 原理 。 我 们 先 从 一 个 回归 与 方差 分 析 (ANOVA) 
的 简单 例子 开始 ， 以 便 帮助 读者 建立 对 类 似 思 路 的 理解 。 其 实 ， 这 些 常 用 的 统 
计 模 型 也 可 以 视 为 分 层 线性 模型 的 特殊 情况 。 本 章 还 对 贯穿 全 书 的 一 些 定义 和 
注释 做 了 概括 。 


初步 知识 
对 某 一 学 校 的 社会 经 济 状况 与 成 绩 关 系 的 研究 
先 设想 ， 在 某 一 学 校 中 ， 处 于 学 生 层 次 的 一 个 自 变量 (比如 ， 社 会 经 济 
状况 socioeconomic status, PKA SES) 与 另 一 个 学 生 层 次 的 结果 变量 ( 如 数 


学 上 成绩， 标注 为 Achieyement) 之 间 有 关系 。 图 2. 1 提供 了 这 一 关系 的 散 点 图 。 
Hh, REH p PEH G 的 直线 较 好 地 代表 了 这 些 散 点 。 于 是 ， 这 些 数据 
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的 回归 方程 为 : 


Y, =B + 有 BY +r, [2.1] 





学 生 的 社会 经 济 状况 


图 2.1 一 个 假设 学 校 的 成 绩 与 社会 经 济 状 况 之 间 关系 的 艇 点 图 


截 距 Bp, 定义 为 ， 当 一 个 学 生 的 社会 经 济 状况 值 SES = 0 时 其 数学 成 绩 的 期 户 
值 。 斜 率 B, 则 为 SES 值 一 个 单位 的 增加 所 期 望 产生 的 数学 成 绩 变化 量 。 误 差 
项 7, 代表 与 某 一 个 特定 学 生 i 相 联系 的 影响 。 典 范 的 做 法 是 ， 我 们 要 假定 " 服 
从 平均 值 为 0、 方 差 为 o* 的 正 态 分 布 ， 即 : r,~N(O, 0°), 

将 自 变量 按 另 一 “对 中 ”测量 方法 将 有 助 于 使 截 距 更 有 意义 。 比 如 ， 候 
设 我 们 通过 用 每 一 SES 值 减 去 其 平均 值 ， 即 起 - 和. ， 便 达到 了 这 种 对 中 
(center), Hp X 便 是 该 校 SES 的 平均 值 。 如 果 我 们 将 Y, EX X, -X.R 
数 来 做 图 (参见 图 2.2) ， 并 加 入 回归 线 ， 这 时 斜率 保持 不 变 ， 并 能 看 到 现在 
RE p, 就 是 数学 成 绩 的 平均 值 。 


D 译注 : 王 吉利 主编 《 汉 美英 汉 统计 大 词典 》( 中国 统计 出 版 社 ，2001) 第 75 页 中 将 其 译 为 集 
中 或 中 心 化 。 
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学 生 的 社会 经 济 状况 
图 2.2 一 个 假设 学 校 的 成 绩 与 社会 经 济 状况 (已 对 中 ) 之 间 关 系 的 散 点 图 


对 两 个 学 校 的 福 会 经 济 状况 与 成 绩 关 系 的 研究 


规 在 我 们 为 两 个 假设 的 学 校 分 别 做 回归 ， 其 相应 的 图 形 为 图 2.3。 两 条 回 
归 线 表明 学 校 1 和 学 校 2 在 两 个 方面 有 所 不 同 。 第 一 ， 学 校 1 的 平均 值 比 学 校 
2 的 平均 值 高 ， 这 -- 差 别 反映 在 两 个 截 距 上 ， 即 Bu >B,,。 第 二 ，SES 对 学 校 1 
的 数学 成 绩 的 作用 较 差 ， 而 对 学 校 2 的 数学 成 绩 的 作用 较 强 ， 反 映 在 两 个 斜率 
的 比较 上 有 B <Bi2 0 





学 生 的 社会 经 济 状况 
A= 学 校 1 B= 学 校 2 


图 2.3 两 个 假设 学 校 的 成 绩 与 社会 经 济 状况 之 间 关系 的 散 点 图 
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如 果 学 生 是 被 随机 分 配 到 这 两 个 学 校 的 话 ， 我 们 便 可 以 说 ,学校 ! 比 学 校 
2 更 “有 效 ” 且 更 “公平 "更 有 效 体现 在 学 校 1 有 较 高 的 平均 成 绩 (BY B,, > 
Bos) ， 更 公平 则 体现 在 学 校 1 的 斜率 较 小 ( 即 B,, <B,,)。 当 然 ， 学 生 并 不 是 被 
随机 分 配 到 各 学 校 的 ， 因 此 不 考虑 学 生 的 成 分 差别 便 不 能 保证 以 上 解释 的 正确 
性 。 然 而 ,这 一 随机 分 配 的 假设 却 阐明 了 分 析 的 目的 ， 并 简化 了 我 们 的 讲解 。 


对 J 个 学 校 的 社会 经 济 状 况 与 成 绩 关 系 的 研究 


再 来 考虑 一 个 对 所 有 学 校 的 总 体 (population) 来 进行 社会 经 济 状况 与 成 
绩 关 系 的 研究 。 假 设 我 们 从 这 一 总 体 中 随机 抽取 / 个 学 校 作 为 样本 ， 其 中 J 是 
一 个 较 大 的 数量 ,那么 现在 再 对 每 个 学 校 分 别 做 散 点 图 分 析 便 不 切实 际 了 。 但 
是 ,我 们 可 以 为 不 同学 校 写 出 一 个 通用 公式 来 表达 这 一 关系 : 


Y; = By +B,(X, -X,) +r [2.2] 


这 里 为 了 简单 起 见 ， 我 们 假定 ,在 各 学 校 都 是 正 态 分 布 且 具有 方差 齐 性 ， 即 r, ~ 
N(O, w )。 注 意 ， 截 忠和 斜率 现在 又 都 加 上 了 下 标 )， 这 样 便 可 以 允许 每 个 学 
校 拥有 其 独特 的 截 距 和 斜率 。 对 于 每 一 个 学 校 ， 有 效 和 公平 都 用 一 对 参数 值 
(Bos By) 来 表示 。 另 外 ， 假 定 学 校 总 体 中 截 距 和 斜率 有 二 元 正 态 分 布 是 明智 
和 方便 的 ， 令 : 


E(B,) = Yos Var(By) = rm 
E(B,) =y, Var(By) = 7n 
Cov( By; By) = To, 


其 中 : 
Yo 为 学 校 平均 成 绩 的 总 体 平均 数 ; 
Tw 为 学 校 平均 成 绩 的 总 体 方 差 ; 
y 为 各 校 社会 经 济 状况 与 成 绩 之 间 斜 率 的 总 体 平均 数 ; 
Tu 为 上 述 各 校 斜 率 的 总 体 方差 ; 
To 为 斜率 和 截 距 之 间 的 总 体 协 方差 。 


Tn 为 止 值 意味 着 平均 成 绩 较 高 的 学校 更 倾向 于 有 正 的 斜率 。 对 这 些 方差 
和 人 协 方差 的 知识 直接 导致 计算 这 些 平均 数 和 和 斜率 之 间 总 体 相关 系数 的 公式 。 
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PiBu By) = tA tet)? 12.3} 


在 实际 中 ， 我 们 很 少 能 知道 上 述 总 体 参数 值 ( 即 yo、 Yis Tus Tos Tu). 
也 并 不 知道 每 个 学 校 的 真实 平均 数 和 斜率 ( 即 Bu 和 有司 ,)， 而 是 根据 样本 数据 
来 估计 它们 : 本 章 的 焦点 只 是 要 关 明 这 些 参数 的 意义 。 有 关 估计 这 些 参数 的 实 
际 过 程 将 在 第 3 章 介绍 ， 并 在 第 14 章 展开 更 多 的 讨论 。 

现在 假设 我 们 已 知 每 一 学 校 的 平均 数 和 斜率 的 真 值 。 图 2. 4 提供 了 一 个 散 
点 图 ， 假设 了 一 组 学 校 样本 的 Bu 与 B, 之 间 的 关系 。 这 个 统计 图 告诉 我 们 ， 这 
些 学 校 在 其 平均 数 和 斜率 方面 如 何 变化 - 请 注意 ， 散 点 在 平均 数 ( 纵 轴 ) 上 
KIERPER (WAD 上 显得 更 为 分 散 。 作 为 一 种 特征 ， 这 意味 着 rw >To 还 
应 注意 ， 这 两 种 作用 倾向 于 负 相 关 ， 即 在 平均 成 绩 (Bu ) 高 的 学 校 中 社会 经 
济 状况 对 数学 成 绩 的 影响 (B) 较 小 。 作 为 另 一 特征 ， 它 意味 着 rn <0。 那 些 
有 效 且 公平 的 学 校 ， 就 是 平均 成 绩 高 ( 即 Bu 值 很 大 ) 且 社 会 经 济 状况 的 作用 
弱 Be ARRI 的 散 点 ， 处 于 散 点 图 的 左上 象限 。 
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学 校 SES HRPE, By 
图 2.4 200 个 假设 党校 的 学 校 平均 数 (WMA) 与 学 校 SES 的 斜率 (MH) 的 散 点 图 


在 通过 图 形 检 查 这 些 学 校 在 其 截 距 和 斜率 上 如 何 变化 后 ， 我 们 可 能 还 希 
望 建立 一 种 模型 来 预测 Bu 与 B,。 有 具体 地 说 ， 我 们 可 以 用 学 校 的 特征 (诸如 
— 组 织 特征 、 政 策 ) 来 预测 效率 与 公平 。 例 如 ， 建 立 一 个 简单 的 标 

ER 所 ,连天 主教 学校 时 赋值 为 1， 过 公立 学 校 时 赋值 为 0。Coleman 、 
te ir h W 与 效率 为 正 相 关 (天 主教 学 校 比 公立 学 
校 的 平均 成 绩 高 ) ， 而 与 斜率 为 负 相关 (就 社会 经 济 状况 对 数学 成 绩 的 作用 
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市 言 ， 在 天 主教 学 校 比 在 公立 学 校 要 小 )。 我 们 可 以 通过 两 个 回归 方程 来 代 
表 这 两 个 假设 。 
By, = Yo + Yo, + uo [2.4a] 
By = ye + ynW, +u (2. 4b] 


其 中 : 

?yo 为 公立 学 校 的 平均 成 绩 ; 

Yor 为 天 主教 学 校 与 公立 学 校 在 平均 成 绩 上 的 差异 ; 

yw 为 公立 学 校 的 社会 经 济 状况 对 平均 成 绩 作 用 的 平均 斜率 ; 

Yu 为 天 主教 学 校 与 公立 学 校 在 社会 经 济 状况 对 平均 成 绩 作 用 斜率 上 的 平 
均 差 异 ( 即 天 主教 学 校 在 “公平 ”方面 的 优越 性 ) ; 

uo 为 在 控制 W, 不 变 时 (REW, 条 件 下 ) 学 校 j 对 平均 成 绩 的 独特 作用 ; 

uy 为 在 控制 W, 不 变 时 (或 在 W, 条 件 下 ) 学 校 j 在 社会 经 济 状况 对 平均 成 
绩 作 用 斜率 上 的 独特 作用 。 


假定 uw, 和 是 平均 数 等 于 0 的 随机 变量 ， 它 们 的 方差 分 别 等 于 rmw 和 Tu ， 
它们 之 间 的 协 方差 等 于 rw。 注意， 这 些 方差 协 方差 成 分 现在 是 有 条 件 ( condi- 
tional) 的 ， 或 称 它们 是 残 差 〈residual) 的 方差 协 方差 成 分 。 也 就 是 说 ， 它 们 
代表 着 控制 W, 以 后 Bu 与 Bu 仍 具 有 的 可 变性 。 

直接 估计 这 些 回 归 方程 的 参数 是 不 可 能 的 ， 因 为 其 结果 (Byt B) 并 未 
得 到 观测 。 然 而 ， 数 据 中 包含 着 这 一 估计 工作 所 需 的 信息 。 很 清楚 ， 如 果 我 们 
将 方程 2. 4a 和 2. 4b 代 人 方程 2. 2， 就 能 得 到 对 上 述 结果 的 预测 方程 : 


Y; = ym + yoW + Yolk - Ks) + yu W(X ~ X,) 
+ uy + u,,(X, - X,,) +r, (2.5) 


注意 ,方程 2.5 并 不 是 标准 的 常规 最 小 二 乘法 (OLS) 所 假定 的 典型 线 
性 模型 。 用 OLS 方法 取得 有 效 估计 和 准确 假设 检验 的 条 件 是 ， 随 机 误差 必须 
独立 ， 服 从 正 态 分 布 ， 并 且 有 相同 的 方差 。 方 程 2.5 的 随机 误差 则 与 此 相 
反 ， 具 有 更 复杂 的 形式 uo +u,(X,-X,) + rs 。 这 样 的 误差 在 每 个 学 校 之 内 
是 相依 的 ， 因 为 在 某 一 学 校 j 中 的 每 个 学 生 的 成 分 uw 和 wu, 是 共同 的 ; 并 且 各 
学 校 的 误差 有 不 同 的 方差 ， 因 为 uy + u,(X,-X,) 值 由 uM uke, HE 
们 在 各 学 校 取 值 不 同 ， 此 外 ， 其 值 还 依赖 于 X; - 六., 值 ， 而 各 学 校 学 生 之 间 
也 存在 差异 。 尽 管 标准 的 回归 分 析 用 在 这 里 不 恰当 ,但 这 一 模型 仍然 可 以 采 
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用 最 大 似 然 法 迭代 程序 进行 估计 〈 这 一 程序 将 在 下 一 章 介绍 ) 。 需 要 指出 的 
是 ， 如 果 每 个 学 校 的 ww 和 uv 值 都 等 于 0 的 话 ， 那 么 方程 2.5 便 等 于 OLS 回 
WR, 

图 2.5 是 按 方程 2.4 定义 的 模型 的 图 示 ， 其 中 两 个 描述 Bu 与 B, 之 间 的 关 
系 图 是 分 别针 对 公立 学 校 和 天 主教 学 校 的 假设 而 绘制 的 。 这 两 个 图 旨 在 反映 
Coleman 等 人 (1982) 的 见解 ， 即 天 主教 学 校 与 公立 学 校 相 比 有 较 高 的 平均 成 
绩 和 较 弱 的 社会 经 济 状 况 的 作用 ， 
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(b) 公立 学 校 
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图 2.5 100 个 假设 的 天 主教 学 校 和 100 个 假设 的 公立 学 校 的 学 校 
FHR (AM) 与 学 校 SES 的 斜率 (MH) 的 散 点 图 
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一 般 模型 及 其 简单 子 模型 


现在 我 们 对 有 关 本 语 加 以 推广 ， 以 便 它 们 可 以 应 用 于 任何 两 层 的 分 层 数据 
结构 。 方 程 2.2 可 称 为 层 -1 模型 (level-1 model); 方程 2.4 为 层 -2 模型 
(level-2 model); 97 #2 2.5 是 组 合 模型 (combined model) 。 在 这 个 学 校 效应 的 
应 用 人 研究 中 ， 层 - 1 的 分 析 单 位 是 学 生 ， 层 - 2 的 单位 是 学 校 。 误 差 项 六 是 层 
-1 的 随机 效应 、 而 误差 项 ww 和 是 层 -2 的 随机 效应 。 此 外 ，Var(r;) 为 层 
-1 的 方差 ，Var(wo)、Var(wwy) 和 Cov( uy, up) WH -2 的 方差 协 方差 成 
分 。B 类 参数 是 层 -1 模型 的 系数 ; y 类 参数 是 层 -2 模型 的 系数 。 

当 层 -1 只 有 一 个 自 变量 AHR -2 也 只 有 一 个 自 变量 W 时 ， 由 方程 
2.2、 方 程 2.4 和 方程 2.5 所 构成 的 模型 是 完全 分 层 线性 模型 的 最 简 形式 。 当 
这 一 模型 中 的 某 些 项 被 设 为 0 值 时 ， 模 型 便 能 被 进一步 简化 ， 有 些 成 为 我 们 十 
分 熟悉 的 模型 。 检 查 一 下 这 些 模 型 很 有 启发 性 ， 既 可 以 示范 分 层 线性 模型 的 应 
用 领域 ， 又 可 以 将 分 层 线性 模型 与 常规 数据 分 析 方法 联系 起 来 。 在 子 模型 从 简 
单 逐 步 转 为 复杂 的 过 程 中 ， 便 成 为 不 同 的 模型 ， 包 括 : 带 随机 效应 的 单 因 素 方 
差分 析 (one-way ANOVA model with random effects); 将 平均 数 作为 结果 的 回归 
HIRI (regression model with means-as-outcomes) ; 带 随机 效应 的 单 因 素 协 方差 分 
Hi (one-way ANCOVA model with random effects); 随机 系数 回归 模型 (ram- 
dom-coefficients regression model); 将 截 距 和 和 斜率 作为 结果 的 回归 模型 ( regres- 
sion model with intercepts and slopes-as-outcomes ) ; 以 及 非 随 机 变化 斜率 模型 


(model with nonrandomly varying slopes) 。 
带 随 机 效应 的 单 因 素 方 差分 析 


最 简单 的 分 层 线性 模型 等 价 于 带 随机 效应 的 单 因素 方差 分 析 。 在 这 种 情况 
F, ie -1 模型 的 B, 对 于 所 有 的 单位 j 被 设 为 0， 因 此 模型 成 为 : 


Y, = By, +7, [2.6] 
我 们 假定 层 -1 中 每 一 项 误差 ,服从 正 态 分 布 ， 平 均值 为 0， 并 且 层 -1 的 


方差 w” 相同 。 注 意 ， 这 个 模型 仅 用 一 个 层 -2 参数 (MRE) 来 预测 层 -1 
中 各 单位 的 结果 。 在 这 种 情况 下 ，p。 就 是 第 j 个 单位 的 平均 结果 ， 即 Bu =p, 
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带 随机 效应 的 单 因 素 方 差分 析 的 层 -2 模型 就 是 将 方程 2. 4a 中 的 yo 设 为 
0， 有 : 


[2.7} 


Bo, = You + My 
其 中 ，yw 代 表 在 这 个 总 体 中 的 结果 的 总 平均 数 (grand mean); 而 ww 为 与 第 j 
个 单位 相 联 系 的 随机 效应 ， 并 是 假定 其 有 平均 数 等 于 0 和 方差 等 于 rm- 
将 方程 2.7 代入 方程 2.6， 得 到 : 


yt [2.8] 


这 样 一 来 ， 公 式 就 的 确 成 为 单 因 素 方 差分 析 模 型 ， 有 总 平均 数 为 yw、 分 组 
( 即 层 -2) 效应 为 ww， 以 及 个 人 ( 即 层 -1) 效应 为 m。 但 这 是 一 个 随机 效应 
模型， 因为 分 组 效应 被 解释 为 随机 效应 - 注意 ， 其 结果 的 方差 是 : 


Var( ¥,) = Var(uy +r) = To +r {2.9} 


分 层 数据 分 析 中 经 常 将 单 因素 方差 分 析 用 作 初 步 分 析 ， 它 可 以 得 到 总 平均 
数 yw 的 点 估计 和 置信 区 各 更 重要 的 是 ， 它 分 别提 供 了 两 个 层次 中 结果 的 变 
化 信息 。 参 数 e 代表 组 内 变化 (within-group variability) ， 而 参数 rw 则 捕获 了 
41 ta) BAL (between-group variability ) 。 在 分 层 模 型 中 ， 我 们 将 方程 2.6 和 方程 
2.7 称 为 完全 无 条 件 的 【fully unconditional) ,: 因为 无 论 是 在 层 -1 还 是 在 层 -2， 
方程 中 都 没有 自 变量 。 

与 单 因素 随机 效应 方差 分 析 相 连 的 一 个 有 用 指标 是 组 内 相关 系数 (intra- 


class correlation coefficient), HARA: 
P fall Ta + 0°) [2.10] 


这 一 指标 测量 了 层 - 2 结果 方差 中 各 单位 之 间 差 别 所 占 的 比例 2。 单 因素 随机 
效应 子 模型 的 应 用 请 参见 第 4 章 。 


将 平均 数 作 为 结果 的 回归 模型 


另 一 种 常见 的 统计 问题 是 通过 分 组 特征 来 预测 各 个 组 的 平均 数 。 这 种 子 模 


LO RE: 从 严格 意义 上 说 ， 这 类 似 于 确定 系数 的 酸 念 。 比 如 回归 中 的 R?， 表 达 的 是 方 益 中 被 解 
释 的 比例 ， 而 这 种 铸 释 比例 不 是 通常 所 说 的 相关 系数 ， 而 是 相关 系数 的 平方 。 


4 。 分 层 线性 模型 : 应 用 与 数据 分 析 方法 


型 的 层 -1 模型 为 方程 2.6， 而 层 -2 模型 为 : 

Bo, = Yoo + Yo W, + uo [2.11] 
在 这 种 简单 的 情况 下 ， 层 -2 模型 有 一 个 自 变 量 WW。 将 方程 2.11 代入 方程 2.6 
便 得 到 一 个 组 合 模型 ; 

Y, = yo + Yor Wy + ty; +r [2.12] 
注意 ， 现 在 uw 与 方程 2.7 中 的 同 项 相 比 有 了 不 同 的 意义 。 尽 管 随机 变量 uy 
来 是 单位 j 的 平均 值 与 总 平均 数 之 间 的 离 差 (deviation) ， 但 它 现在 代表 的 是 残 
% (residual)D, Bp; 

ty, = Bo - Yw ~ Yor W; 
类 似 地 ，uo 的 方差 rw 现在 是 残 差 的 方差 ， 或 者 称 为 Bu 在 控制 W, 以 后 的 条 件 方 


差 (conditional variance) 。 应 用 估计 方程 2. 12 与 将 样本 平均 数 作为 结果 的 标准 
回归 相 比 的 优越 性 将 在 第 5 章 加 以 讨论 。 


带 随 机 效应 的 单 因素 协 方差 分 析 


让 我 们 重新 回 到 完全 模型 ( 即 方程 2. 2 和 方程 2.4) ， 将 层 -.2 的 系数 yw 、 
Yu 和 随机 效应 uw,，( 对 所 有 的 j) 设 为 0。 其 结果 ， 模 型 成 为 带 随机 效应 的 单 因 
察 协 方差 分 析 ， 并 以 层 -1 中 的 一 个 自 变量 作为 协 变量 (covariate)。 层 - 1 模 
型 为 方程 2. 2， 但 是 现在 自 变量 X, 是 按 总 平均 数 对 中 的 。 即 ; 


¥, = By +By(X, -X..) +r, [2.13] 

层 -2 模型 变 为 : 
By = Yoo + um [2. 14a] 
By = Yn [2. 14b] 


注意 ， 方 程 2. 14b 表示 ， 对 于 每 一 个 层 -2 单位 ， ,的 作用 已 经 被 规定 为 相同 
的 固定 值 。 
这 一 组 合 模型 变 为 : 


D HE: 在 统计 中 ， 离 差 通常 指 案例 值 与 平均 值 之 差 ， 而 残 差 通常 指 观测 值 与 回归 预测 值 之 差 。 
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Y. = Yæ + yo XY, — X.) tly +h, [2.15] 


方程 2.15 与 标准 协 方差 分 析 模型 的 唯一 差别 (参见 Kirk, 1995, 第 15 章 ) 是 ， 
这 里 的 分 组 效应 ww 被 理解 为 随机 的 ， 而 不 是 固定 的 。 正 如 在 协 方差 分 析 中 ， 
yu 为 汇合 的 〈pooled) 组 内 的 说, 对 的 回归 系数 了 。 每 一 B。 现 在 是 层 -2 各 单 
位 对 其 在 上 其 别 调整 后 的 结果 的 平均 数 。 更 具体 地 说 , By = jp - yo (Ky - 
No) FOP yy SBE RE jf 的 平均 成 绩 。 我 们 还 注意 到 ，Var (7,) =P 现在 是 经 
层 -1 的 协 变量 X, 调 整 后 的 残 差 的 方差 。 

对 随机 效应 协 方差 分 析 的 一 种 扩展 容许 引入 层 -2 的 协 变量 。 比 如 ， 如 果 
认为 系数 yw 不 能 省 略 ， 那 么 组 合 模型 将 呈现 下 列 形 式 ; 


Yy = Yæ + YW, + Yol,- Y+ ug + Ty [2. 16} 


这 一 模型 规定 了 层 -2 的 协 变量 W,， 但 是 也 控制 了 层 - 1 的 协 变量 ,的 影响 ， 
以 及 层 -2 单位 的 随机 效应 uo。 很 有 意思 的 是 ,方程 2.16 的 所 有 这 些 参数 能 
够 用 下 一 章 所 介绍 的 方法 来 进行 估计 。 然 而 ， 经 典 的 固定 效应 (fixed effects) 
的 协 方差 分 析 却 做 不 到 ， 而 且 经 典 的 协 方差 分 析 模 型 假定 协 变 效应 ( covariate 
effect) yw 在 每 个 组 都 相同 。 应 用 随后 三 节 中 所 描述 的 模型 ( 即 对 随机 变化 系 
数 和 对 非 随机 变化 系数 的 回归 模型 ) 却 很 容易 地 摆脱 了 回归 的 同 质 性 (homo- 
geneity) 假定 的 约束 。 我们 将 在 第 5 章 示范 应 用 随机 效应 协 方差 分 析 模 型 来 分 
析 -- 套 关于 学 生 作文 教学 改革 的 数据 。 


随机 系数 回归 模型 


上 上 面 所 讨论 的 所 有 子 模 型 都 属于 随机 截 距 模型 (random-intercept models) , 
其 中 只 有 层 -1 的 截 距 系数 Bu 被 视 为 是 随机 的 。 在 单 因素 方差 分 析 或 将 平均 数 
作为 结果 的 回归 中 ， 层 - 1 模型 不 存在 斜率 。 在 随机 效应 的 协 方差 分 析 模 型 
中 ， 虽 然 包括 B, ， 但 却 限 制 其 对 所 有 的 组 有 共同 的 效应 。 

分 层 线性 模型 主要 的 研究 应 用 都 涉及 将 层 - 1 的 斜率 设 为 在 层 - 2 单位 之 
间 随 机 变化 。 这 类 应 用 中 最 简单 的 情况 是 随机 系数 回归 模型 。 在 这 些 模 型 中 ， 


DO Rk: 比如 ， 方 券 分 析 中 的 汇合 方差 通常 指 将 所 有 分 组 内 部 的 变化 集中 在 一 起 计算 的 方差 ， 女 
用 各 组 平均 值 计 算 的 离 差 平方 和 。 这 里 汇合 的 回归 系数 是 指 ， 将 各 组 的 了 的 组 内 离 差 汇合 起 来 
EHEM, ROY NY 的 回 妇 系数 . 
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层 -1 的 截 距 和 层 - 1 的 一 个 或 多 个 斜率 是 随机 变化 的 ， 但 本 书 并 不 想 预测 这 
种 变化 。 
具体 而 言 ， 层 - 1 模型 与 方程 2. 2 相同 。 层 - 2 模型 仍 是 方程 2. 4 的 简化 
式 ， 其 中 yo 和 yu 被 设 为 0. 因此 ， 层 -2 模型 成 为 : 
Bo, = Yoo + to, [2. 178] 
B, = Yo + k [2. 17b] 


其 中 : 
Ym 是 层 -2 所 有 单位 的 平均 截 距 ; 
?yi 是 层 -2 所 有 单位 的 平均 回归 斜率 ; 
uw 是 层 -2 上 与 单位 j 相连 的 截 距 上 的 特性 增 基 ; 
wj 是 层 -2 上 与 单位 j 相 连 的 斜率 上 的 特性 增 基 。 


HE -2 的 随机 效应 的 离散 情况 表达 为 方差 协 方差 矩阵 ， 
val | = [= | =T [2.18] 
Hp: 


Var( uy) = To =E -1 中 所 有 截 距 的 无 条 件 方差 

Var(u,,) =7,, = 层 -1 中 所 有 斜率 的 无 条 件 方差 ; 

Cov( uy, uy) =ro = 层 -1 中 截 距 与 斜率 之 间 的 无 条 件 协 方差 。 
注意 ， 我 们 称 这 些 为 无 条 件 方差 协 方差 成 分 是 因为 无 论 是 在 方程 2. 17a 还 是 在 
方程 2. 17b 中 都 不 包含 层 -2 的 自 变 量 。 与 此 类 似 ， 我 们 将 方程 2. 17a 和 方程 
2. 17b 作为 一 个 无 条 件 层 -2 模型 。 

将 方程 2. 17a 和 方程 2. 17b 中 的 Bu 和 有 代入 方程 2. 2 便 得 到 一 个 组 合 
模型 ; 

u = Yo + Yl X, = Xx,) + uy, + uy (KX; -¥,) +r [2.19] 
这 个 模型 意味 着 结果 变量 凡是 平均 回归 方程 yo + yof -X,) 再 加 上 随 


机 误差 的 三 个 成 分 的 函数 ， 单位) 对 平均 数 的 随机 效应 uo; uy (Xy -X,), X 
中 ui 是 单位 /对 斜率 B, 的 随机 效应 ; 以 及 层 -1 RA ryo 
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将 截 距 和 斜率 作为 结果 的 回归 模型 


随机 系数 回归 模型 可 以 用 来 估计 贯穿 层 -2 各 单位 的 回归 系数 (包括 截 距 
MAK A) 上 的 变化 ,下 -- 个 合乎 逻 寿 的 步骤 便 是 对 这 一 变化 建立 模型。 
比如 在 第 4 章 ， 我 们 所 要 解决 的 问题 是 ;为 什么 一 些 学 校 平均 成 绩 会 较 高 ， 为 
什么 在 一 些 学 校 学 生 的 社会 经 济 状况 对 其 成 绩 影 响 较 大 ,学校 ( 层 -2 单位 ) 
本 身 的 哪些 特征 有 助 于 解释 上 述 疑 问 。 

在 层 -工具 有 一 个 自 变 生 ,县 层 -2 也 只 有 一 个 自 变 量 多 的 情况 下 ， 这 
些 问 题 的 解决 可 以 运用 “完全 模型 ”的 方程 2. 2 和 方程 2.4。 当 然 ， 这 一 模型 
也 随时 可 扩展 到 分 析 多 个 X 和 多 个 W 时 的 效应 (参见 “基本 分 层 线性 模型 的 
推广 ”一 节 )， 


非 随 机 变化 和 儿 率 模型 


在 一 些 情况 下 ， 研 究 人 员 能 二 分 成 功 地 预测 回归 斜率 B, 的 变化 。 比 如 ， 
也 许可 以 发 现 方程 2 4b 中 层 -2 自 变量 W, 的确 可 以 预测 层 - 1 的 斜率 B,。 实 
际 上 ， 和 研究 人 员 也 许可 以 发 现 ,在 控制 了 W 之 后 ，B, MRED (MPR 
2. 4b PRI uM TH) 十 分 接近 于 0。 这 种 情况 意味 着 ， 一 旦 控制 了 W, 
率 的 方差 就 变 得 很 小 ， 甚 至 没有 变化 ， 那 就 没什么 要 解释 的 了 。 出 于 追求 统计 
上 有 效 和 计算 的 稳定 性 (在 第 9 章 加 以 讨论 )， 明智 的 做 法 是 设 u, 值 等 于 0。 
这 样 一 来 便 消除 了 斜率 的 残 差 方差 r, ， 以 及 斜率 与 截 距 之 间 的 残 差 协 方差 
Tu， 用 不 着 再 将 它们 作为 参数 来 估计 了 。 

如 果 方 程 2 4b 中 的 残 差 u, 真 的 被 设 为 0， 层 -2 的 斜率 模型 将 变 为 : 


By = Yu + YnW, [2. 20] 
再 将 这 一 模型 与 方程 2. 2 和 方程 2. 4a 组 合 起 来 ， 便 得 到 一 个 组 合 模型 ; 
Y, = Yæ + yoW, + yol, -¥,) + Yu WN, -X,) + uy + ry [2.21] 


在 这 个 模型 中 ， 斜率 在 各 组 之 间 确 实 发 生 了 变化 ， 但 它们 的 变化 却 是 非 随 机 的 。 
基体 地 说 ， 正 如 方程 2.20 ER, PPR B, 的 变化 是 严格 作为 W, 的 函数 发 生 的 。 
我 们 注意 到 ,方程 2.21 可 以 被 视 为 我 们 称 之 为 随机 截 距 模型 的 另 一 个 例 
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子 ， 因 为 Bu 是 唯一 的 一 个 随机 变化 于 层 -2 各 单位 之 间 的 成 分 。 总 而 言 之 ， 分 
层 线性 模型 可 以 包括 多 个 层 -1 自 变量 ， 并 且 可 以 设 定 为 任何 随机 变化 的 、 非 
随机 变化 的 、 固 定 的 斜率 组 合 。 


本 节 提 要 


我 们 已 经 介绍 了 层 -1 只 有 一 个 自 变量 县 层 -2 也 只 有 一 个 自 变量 W, 
的 简单 的 分 层 线性 模型 。 在 这 种 情况 下 ， 层 - 1 模型 (方程 2.2) 定义 了 两 个 
参数 ， 即 截 距 与 斜率 。 正 如 方程 2. 4a 和 方程 2. 4b 所 示 ， 在 层 -2， 它 们 都 可 
以 由 W 来 预测 ， 并 且 都 存在 一 个 随机 变化 成 分 。 所 形成 的 完全 模型 ， 如 方程 
2.5 所 示 ， 便 是 迄今 为 止 我 们 所 考虑 的 最 具 一 般 性 的 模型 。 要 是 完全 模型 的 某 
些 要 素 被 强制 设 为 无 效 值 ， 就 得 到 某 种 子 模型 ， 既 可 以 作为 完全 分 晨 模 型 分 析 
的 初步 尝试 ， 也 可 以 作为 对 完全 模型 更 简约 的 概括 。 

上 面 介绍 的 六 种 子 模型 可 以 按 不 同方 式 加 以 划分 。 我 们 区 分 了 随 贡 截 距 模 
型 与 随机 变化 斜率 模型 。 带 随机 效应 的 单 因素 方差 分 析 模型 、 将 平均 数 作为 结 
果 的 回归 模型 、 带 随机 效应 的 单 因 素 协 方差 分 析 模 型 以 及 非 随机 变化 斜率 模 
型 ， 都 是 随机 截 距 模型 。 在 这 类 模型 中 ， 方 差 成 分 只 有 层 - 1 的 方差 A 
层 -2 的 方差 rw。 我 们 注意 到 ， 在 方差 分 析 中 ， 以 及 在 将 平均 数 作为 结果 的 
模型 中 ， 根 本 不 存在 层 -1 斜率 。 在 协 方差 分 析 模 型 中 ， 层 -1 斜率 存在 但 被 
设 为 贯穿 层 -2 各 个 单位 固定 不 变 。 在 非 随机 变化 斜率 模型 中 ， 斜 率 被 设 为 严 
格 作为 已 知 W 的 函数 变化 ， 并 且 不 存在 其 他 的 随机 成 分 。 与 此 相反 ， 随 机 系 
数 模型 与 将 斜率 和 截 距 作为 结果 的 模型 容许 截 距 和 斜率 随机 变化 。 

另 一 种 划分 类 型 的 标准 是 看 模型 中 是 否 包 含 层 际 互动 项 ( cross-level in- 
teraction terms), WEAN ,,W,(X, -X,). ARKH, RERA IM SLAF hE 
化 ， 组 合 模型 中 便 会 包含 这 种 层 际 互动 项 。 这 种 情况 发 生 于 两 种 子 模型 中 ， 
Bl: 将 截 距 和 斜率 作为 结果 的 模型 ， 以 及 非 随机 变化 斜率 模型 。 


基本 分 层 线性 模型 的 推广 
多 元 X 和 多 元 W 


假设 现在 研究 人 员 想 引入 第 二 个 层 ~ 1 自 变 量 。 令 1 表示 上 面 所 讨论 过 
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的 原 自 变 量 ， 再 令 和 ,表示 第 二 个 层 - 1 自 变 量 。 在 现在 的 情况 下 ， 假 设 层 -2 
, 仍 只 有 一 个 自 变 量 W. 假定 对 Xi 和 分别 按 其 组 平均 数 对 中 (group-mean 
centering), WAR -1 模型 便 成 为 : 


Yi = By +B, (Xn -Ks) + By (May — Xs) + [2.22] 


同伴 ， 建 立 模型 时 对 B, 还 是 有 三 种 选项 。 第 一 种 选项 为 将 ,的 效应 设 为 
在 层 -2 各 单位 之 间 不 变 ， 这 意味 着 ， 


By = Ym 


其 中 ，yw 为 Yuw 对 层 -2 所 有 单位 的 共同 效应 。 我 们 认为 By 的 效应 在 层 -2 所 
有 单位 固定 (fixed) KE, 

第 二 种 选项 为 在 模型 中 将 斜率 By 设 为 一 个 函数 ， 即 平均 值 yo 再 加 上 一 项 
与 层 -2 各 单位 相 联系 的 随机 效应 ; 


By = yw + uy [2.23] 


这 里 ，B, 是 随机 的 。 注 意 ， 方 程 2. 23 并 没有 为 B, 设 任何 自 变量 。 但 是 如 果 假 
设 这 个 斜率 依赖 于 及， 那么 便 设 置 了 一 个 将 斜率 作为 结果 的 模型 ， 其 公式 为 


By = yo + Ya W; + ua [2.24] 


按照 这 个 模型 ， 斜 率 B; 变 化 的 一 部 分 能 够 由 W 来 预测 ， 但 是 其 随机 成 分 u, 仍 
然 未 得 到 解释 。 另 一 方面 ， 还 存在 一 种 可 能 性 ， 即 一 旦 考虑 W, 的 影响 ，B, 的 
残 差 变异 [ 即 Var(ux) =7;,] 便 可 以 忽略 。 那 么 ， 要 是 模型 将 这 一 残 差 设 为 0 
就 是 合理 的 ， 于 是 有 : 


By = Ya + yu W, [2.25] 


在 这 第 三 种 情况 下 ，B: 是 一 个 非 随机 变化 的 斜率 ， 因 为 它 严格 地 作为 自 变 量 
W, 的 函数 来 变化 。 

就 此 ， 我 们 所 说 的 仅 限 于 只 有 一 个 层 -2 自 变量 也， 而 多 元 W, 的 应 用 也 
是 显而易见 的 ; 并 且 层 -2 模型 不 要 求 每 个 方程 相同 ， 可 以 应 用 一 套 W 于 截 
距 ， 应 用 不 同 的 一 套 于 B, ， 再 应 用 另 一 套 于 B,， 等 等 。 但 是 ， 当 非 对 称 设置 
(nonparallel specification) 时 ， 对 其 结果 的 解释 必须 特别 小 心 (参见 第 9 BE) 。 
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对 层 -1 和 层 -2 上 的 误差 结构 的 推广 


按 方程 2. 2 和 方程 2.4 设置 的 模型 假定 在 层 -1 和 层 -2 都 有 同 质 性 误差 
(homogeneous errors)。 这 一 假定 对 许多 类 型 的 多 层 问题 都 是 可 接受 的 。 正 如 在 
第 5 ~8 章 所 讨论 的 大 多 数 例子 一 样 ， 大 多 数 发 表 的 应 用 研究 也 都 建立 在 这 一 
假定 基础 上 。- 

然而 ， 这 个 模型 很 容易 扩展 为 在 两 个 层次 都 具有 更 复杂 的 误差 结构 。 与 每 
个 层 -2 单位 对 应 的 层 - 1 方差 可 以 不 同 ， 将 其 标注 为 e; 或 者 ， 它 也 可 以 是 
某 些 层 - 1 特征 量度 的 函数 (第 5 章 中 有 这 种 扩展 的 模型 框架 ) 。 层 -2 与 此 类 
似 、 在 层 -2 单位 的 不 同 子 群 中 可 能 存在 不 同 的 协 方差 结构 ， 这 会 导致 对 层 -2 
单位 的 不 同 子 群 有 不 同 的 矩阵 。 


超出 基本 的 两 层 分 层 线性 模型 的 扩展 


本 章 通过 两 层 模型 所 介绍 的 核心 思路 可 以 直接 扩展 到 三 层 或 更 多 层次 的 模 
型 。 这 些 扩展 将 在 第 8 章 中 加 以 描述 和 示范 。 不 考虑 层次 的 数目 ， 基 本 分 层 线 
性 模型 的 共同 特点 是 ， 层 -1 结果 变量 了 是 连续 的 ， 并 假定 为 正 态 分 布 ， 依 模 
型 中 所 设 的 层 - 1 自 变量 的 条 件 变 化 。 在 过 去 10 年 中 ,模型 的 扩展 已 经 超出 
了 基本 分 层 线性 模型 的 框架 ， 发 展 到 可 以 包括 二 分 类 的 层 - 1 结果 、 计 数 数 
据 、 多 分 类 的 结果 。 对 缺失 数据 的 模型 、 对 潜在 变量 效应 的 模型 以 及 对 更 复杂 
的 数据 设计 包括 交互 随机 效应 的 模型 都 已 经 形成 。 尽 管 这 些 扩展 模型 的 估计 方 
法 更 为 复杂 ， 但 基本 的 概念 思路 及 其 模型 框架 的 扩展 都 是 相当 自然 而 然 的 。 总 
而 言 之 ， 现 在 建立 模型 的 可 能 范围 比 本 书 第 1 版 出 版 时 要 更 为 丰富 了 。 本 书 的 
第 三 部 分 便 是 第 2 版 中 新 加 的 内 容 ， 对 这 些 新 发 展 做 了 介绍 。 


选择 X 和 WHET OP) 


在 所 有 定量 研究 中 的 一 个 基本 要 求 是 ， 所 研究 的 变量 应 具有 准确 的 意义 ， 
因而 保证 其 统计 结果 能 够 与 该 研究 所 关注 的 理论 问题 联系 起 来 。 在 分 层 线性 模 
WLP i-i 的 截 距 和 斜率 成 为 层 -2 的 结果 变量 。 十 分 关键 的 是 ， 这 些 结果 
变量 具有 清晰 的 、 可 理解 的 意义 。 
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层 -1 模型 中 截取 的 意义 依 束 于 层 -1 自 变量 了 的 测量 位 置 。 比 如 ， 我 们 
知道 .在 一 个 简单 模型 中 ， 即 : 


Ky = By + BX, +r; [2. 26] 


截 距 Bu 定义 为 第 7 AE RL NN 0 的 学 生 的 期 望 结果 。 如 果 研 究 人 员 要 
使 模型 能 够 解释 在 Bu 上 的 变化 ,所 有 层 -1 自 变量 的 测量 选择 就 变 得 十 分 重 
要 。 然 而 ， 尤 其 是 当 X =0 的 意义 并 不 清楚 时 ， 研 究 人 员 便 需要 对 加 进行 转 
换 ， 或 者 说 是 “给 心 选 择 一 个 定位 "”， 以 便 使 ,有 更 加 明确 的 意义 。 在 某 些 
情况 下 ， 适 当选 择 定位 也 可 能 是 为 了 保证 对 分 层 线 性 模型 进行 估计 时 得 到 数量 
方面 的 稳定 性 。 

类 似 地 ， 对 层 -2 模型 的 截 距 ( 即 方程 2. 4a 和 方程 2.4b 中 yw 和 ya) 的 
解释 也 依赖 于 W, 变量 的 定位 。 估 计 方 面 的 数量 稳定 性 虽然 不 受 WW 类 变量 的 影 
响 ， 但 是 一 个 适当 选择 的 定位 可 以 有 助 于 对 结果 的 解释 。 下 面 ， 我 们 描述 一 些 
常用 的 对 不 和 四 的 定位 选择 ， 即 对 中 (centering), 


多 变量 的 定位 


可 以 考虑 下 定位 的 四 种 可 能 性 : 蕊 的 自然 测量 ， 按 总 平均 数 对 中 ， 按 组 平 
均 数 对 中 ， 以 及 其 他 的 工 测 量 定位 。 我 们 假定 邯 为 定 距 测量 ， 有 关 虚 拟 变量 
的 情况 将 另外 加 以 考虑 。 

们 的 自然 测量 。 尽 管 工 的 自然 测量 也 许 在 一 些 应 用 中 是 很 适当 的 ， 但 是 在 
其 他 一 些 情况 下 却 可 能 导致 无 意义 的 结果 。 比 如 ， 息 设 在 是 学 业 能 力 测 验 
(Scholastic Aptitude Test， 简 标 为 SAT) 值 ， 其 值 域 为 200 ~ 800, FH, MH 
Bu 应 为 第 /个 学 校 的 具有 SAT 值 为 0 的 学 生 的 期 望 结 果 。 在 这 种 情况 下 ， 参 数 
pu 其 实 没有 意义 ， 因 为 这 一 测试 的 最 小 值 也 有 200。 在 这 种 情况 下 ， 截 距 与 斜 
率 之 间 的 相关 将 倾向 于 - 1.0。 其 结果 是 ， 截 距 主要 是 由 斜率 决定 的 。 于 是 ， 
那些 SAT 与 结果 之 间 的 斜率 为 强 正 值 的 学 校 便 会 有 很 低 的 截 距 ; 与 此 相反 ， 
那些 SAT 与 结果 之 间 的 斜率 值 可 忽略 不 计 的 学 校 便 会 有 很 高 的 截 距 。 

当然 ， 在 某 些 应 用 中 式 的 0 值 实际 上 是 有 意义 的 。 比 如 ， 如 果 X 是 药物 
实验 的 用 药 量 ，X, =0 意味 着 第 j 组 的 第 i 个 研究 对 象 根本 没有 用 药 。 其 结果 ， 
FH Bu 便 是 这 样 的 研究 对 象 的 期 望 结果 ， 即 B。= E(Y,1 X，= 0) ,需要 强调 的 
R, FRX, =0 的 意义 总 是 很 重要 的 ， 因为 它 决 定 了 对 Bu 的 解释 。 
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按 总 平均 数 对 中 -如 上 所 述 (参见 “ 带 随 机 效应 的 单 因 素 协 方差 分 析 ” 
一 节 ) ， 对 变量 站 围绕 其 益 平均 数 变化 的 情况 进行 对 中 测量 经 常 很 有 用 。 在 这 
种 情况 下 , 层 -1 自 变 量 有 以 下 形式 ; 


(x, -F.) {2.27] 


现在 ， 截 距 Bu 为 那些 NAS FEY MN TERA. TAR 
协 方差 分 析 模 型 中 ， 这 种 对 %y 值 的 测量 是 标准 测量 方法 。 正 如 在 协 方差 分 析 
中 那样 ， 按 总 平均 数 对 中 将 使 截 距 能 被 解释 为 对 第 / 组 的 调整 平均 数 (adjusted 


mean), E; 
Ba = ps =B, (X - X.) 


类 似 地 ，Var(Bu) =ro 为 层 -2 各 单位 的 调整 平均 数 的 方差 。 
按 层 -2 平均 数 (组 平均 数 ) 对 中 。 另 一 选项 是 将 原 自 变量 按 其 所 属 的 层 -2 
单位 平均 数 做 对 中 测量 ， 即 : 


(xX, -X,) (2. 28] 


在 这 种 情况 下 ， 截 距 Bu 成 为 对 应 组 1 的 未 调整 的 平均 数 ， 即 : 


By = bs, [2.29] 


并 且 Var(Bu) 现在 就 是 层 -2 PAF u, MZ. 

其 他 的 下 测 量 定位 。 有 时 ， 选 择 特殊 的 工 定 位 具有 意义 。 在 一 些 情况 下 , 
自 变量 的 总 体 平 均 数 为 已 知 ， 而 研究 人 员 可 能 希望 将 截 距 Bw 定义 为 第 j 组 的 
“总 体 平 均 人 ” (average person in the population) 的 期 望 结 果 。 这 时 , B-1A 
变量 为 Ys 原 值 减 去 总 体 平均 数 。 

在 应 用 两 层 分 层 线性 模型 研究 成 长 的 分 析 中 ， 涉 及 时 间 序 列 的 观测 数据 ， 
所 以 层 - 1 单位 为 不 同 的 时 间 场 合 ， 而 层 - 2 单位 则 是 不 同 的 个 人 。 研 究 需要 
通过 定义 层 -1 自 变量 的 测量 单位 使 截 距 成 为 第 i 个 人 在 某 一 特定 有 理论 意义 
的 时 间 (如 刚 进入 学 校 的 时 候 ) 上 的 期 望 结果 。 只 要 数据 是 围绕 这 一 时 点 的 ， 
这 种 定义 就 十 分 恰当 。 这 一 类 的 例子 将 在 第 6 章 和 第 8 章 加 以 示范 。 

虚拟 变量 。 考 虑 所 熟悉 的 层 - 1 模型 ; 


Y; = By +B,X, +1, (2.30) 
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其 中 的 X, 现 在 是 一 个 标识 变量 或 称 虚 拟 变量 ， 即 ， 当 学 校 j 的 对 象 i 为 女生 
时 ,不 ,赋值 为 1!， 否 则 赋值 为 0。 在 这 种 情况 下 ， 截 距 B, 定 义 为 第 j 组 的 男生 
的 期 望 结果 ( 即 对 有 XX, =0 的 学 生 的 预测 值 ) 。 注 意 ， 这 时 Var(By,) = 7w 便 是 
贯穿 各 学 校 男生 的 结果 平均 数 的 方差 。 

尽管 乍 看 起 来 对 层 -1 的 虚拟 变量 做 对 中 测量 显得 有 些 奇怪 ， 但 这 其 实 是 
适当 的 ， 并 且 也 是 十 分 有 用 的 。 比 如 对 性 别 所 设 的 标识 变量 按 总 平均 数 六 .做 
对 中 测量 。 对 中 后 的 自 变量 可 以 取 两 种 值 ， 当 对 象 为 女生 时 ，X, -下 .将 等 于 
样本 中 男生 所 占 的 比例 ; HRABE, X-X. 将 等 于 女生 比例 的 负数 。 
正如 当 层 -1 自 变量 为 连续 变量 且 按 相应 的 总 平均 数 对 中 时 ， 截 距 B, 为 第 j 个 
单位 的 调整 平均 数 结果 。 而 在 虚拟 变量 的 情况 下 ， 它 是 对 单位 之 间 的 女生 比例 
差别 进行 调整 。 

作为 另 一 种 选择 ， 我 们 可 以 按 组 平均 数 对 中 。 对 于 女生 ， 克 -区 ,将 等 于 
第 j 个 学 校 中 男生 所 占 的 比例 ; 对 于 男生 ，X, -六 .将 等 于 第 j 个 学 校 中 女生 比 
例 的 负数 。 在 按 组 平均 数 对 中 时 ，X, 是 虚拟 变量 这 一 事实 并 不 改变 对 Bu 的 解 
释 ， 这 一 截 距 仍然 代表 第 7 个 单位 的 平均 结果 As o 

总 之 ， 对 一 分 类 自 变 量 的 几 种 位 置 选 择 都 能 产生 有 意义 的 结果 。 再 次 重 
申 ， 研 究 者 的 责任 便 是 在 解释 结果 时 考虑 到 位 置 的 影响 ， 当 有 多 个 虚拟 变量 时 
更 要 注意 。 比 如 ， 在 学 校 作 用 研究 中 对 白人 、 女 性 ， 以 及 曾 受过 幼儿 教育 的 学 
生 采 用 标识 ， 学 校 /的 截 距 便 可 能 是 非 白人 、 男 性 、 未 受过 幼儿 教育 的 学 生 的 
期 望 结果 。 这 也 许 是 或 者 也 许 不 是 研究 者 所 想 要 的 截 距 。 还 要 强调 的 是 ， 要 对 
每 个 层 -1 自 变量 的 位 置 选 择 十 分 清醒 ， 因 为 它 影 响 到 对 Bu、Var(Bu) 以 及 
一 切 涉及 B。 的 协 方差 的 解释 。 

总 而 言 之 ， 对 位 置 的 合理 选择 依赖 于 研究 目的 ， 没 有 普遍 适用 的 准则 。 然 
而 重要 的 是 ， 研 究 者 需要 根据 研究 目的 审慎 地 考虑 位 置 的 选择 ， 并 且 当 解释 结 
果 时 也 需要 考虑 到 测量 位 置 的 情况 。 

此 外 ， 在 某 些 情况 下 ， 对 层 -1 自 变量 的 位 置 选择 还 影响 到 对 层 - 2 方差 
协 方差 成 分 T 以 及 对 层 -1 随机 系数 B, 的 估计 。 在 组 织 研究 和 成 长 曲线 应 用 中 
都 会 出 现 一 些 复杂 情况 ， 读 者 可 以 分 别 参考 第 5 章 和 第 6 章 中 对 这 些 技术 考虑 
的 进一步 讨论 。 


W 变量 的 定位 


总 的 来 说 ， 对 WW 变量 的 位 置 选 择 不 像 对 层 - 1 自 变量 那样 关键 。 数 量 稳定 
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性 问题 一 般 可 能 性 较 小 ， 除 非 是 当 层 - 2 引入 了 交叉 乘积 项 (cross-product 
terms， 比 如 以 W, WAR 了 ms 的 形式 引入 自 变 量 组 ) 。 不 管 对 层 - 2 自 变量 
采用 什么 测量 选择 或 不 做 选择 ) ， 所 有 y 系数 的 解释 都 很 容易 。 然 而 ， 更 为 方 
便 的 是 将 所 有 层 - 2 自 变量 按 其 相应 的 总 平均 数 对 中 ， 比 如 WW, -W,. 。 


本 章 术语 及 注释 的 概括 
简单 的 两 层 模型 
分 层 形式 的 模型 : 
fe -1 (如 学 生 ) Yy = By + ByX,y + 7, 
层 -2 (如 学 校 ) Boy = Yoo + Yo: ¥; + Uy, 
By = Yo + yuW + wy 
组 合 形式 的 模型 ; 


Y, = yo + YioXs + yo Wty XSW + uy + Xo + 


其 中 ， 我 们 假设 : 


9 


E(r) =0 Var(m) =o 
E "oj " 0 Var * = ty Ta =T 
uy 0 uy To Tn 
Cov(ug,r,) = Cov(u,,r;) = 0 


注释 与 术语 概括 


存在 i=1，…, n 个 层 -1 单位 分 别 从 属于 j=1，…， J 个 层 -2 单位 ， 
RARE REFER jo 

Bu 和 有 ,为 层 -1 的 系数 。 它 们 可 能 采取 三 种 形式 : 

MEHR -1 系数 〈( 如 单 因素 随机 效应 协 方差 分 析 模 型 中 的 Bp,,， 匈 方程 
2. 14b); 

非 随机 变化 的 层 -1 系数 〈 如 非 随机 变化 斜率 模型 中 的 B,， 见 方程 2. 20); 
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随机 的 层 -1 系数 (如 随机 系数 回归 模型 中 的 Bu 和 B,,， 见 方程 2. 17a 和 
方程 2. 17b; 以 及 将 截 距 和 斜率 作为 结果 的 模型 中 的 Bu 和 Bu， 见 方程 2. 4a 和 
方程 2.4b) 。 

Ym，"…，Yu 是 层 -2 的 系数 且 称 为 固定 效应 ; 

AV AUR -1 的 自 变量 (如 学 生 的 社会 阶层 、 种 族 、 能 力 等 特征 ) ; 

W, 为 层 -2 的 自 变量 (如 学 校 的 规模 、 类 别 、 社 会 构成 等 特征 ) ; 

7, 为 层 -1 的 随机 效应 ; 

um 和 wj 为 层 ~2 的 随机 效应 ; 

o AR -1 的 方差 

To. Tor TMi - 2 的 方差 协 方差 成 分 。 


一 些 定义 


组 内 相关 系数 ( 见 “ 带 随机 效应 的 单 因素 方差 分 析 ” 一 节 ) ; 
P = Tov(rn +0") 


这 一 系数 测量 结果 方差 中 组 间 (BME -2 各 单位 之 间 ) 部 分 所 占 的 比例 。 它 有 
时 也 被 称 为 群 效应 (cluster effect) ， 只 应 用 于 随机 截 距 模型 ( 即 r, =0 时 )。 
pw 和 ,的 无 条 件 方差 协 方差 是 指 随机 系数 回归 模型 中 层 -2 方差 协 方差 的 
取 值 。 
Bu 和 ,的 条 件 方差 协 方差 或 残 差 的 方差 协 方差 是 指 在 层 - 2 模型 中 加 入 自 
变量 以 后 层 -2 方差 协 方差 的 取 值 (参见 方程 2. 4a 和 方程 2. 4b) 。 


子 模型 的 类 型 


单 因素 随机 效应 方差 分 析 横 型 不 涉及 层 - 1 或 层 -2 的 自 变量 ， 我 们 称 其 
为 完全 无 条 件 模型 。 

随机 截 距 模型 只 有 一 个 随机 的 层 - 工 系数 Bu 。 

将 平均 数 作为 结果 的 回归 模型 是 随机 截 距 模型 的 一 种 形式 。 

单 因素 随机 效应 协 方差 分 析 模 型 基本 与 经 典 的 协 方差 分 析 模型 相同 ， 只 是 
层 -2 效应 被 视 为 是 随机 的 。 
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随机 系数 回归 模型 容许 所 有 层 -1 系数 随机 变化 。 这 种 模型 在 层 -2 是 无 
条 件 的 。 


对 中 的 定义 pu 的 含义 
采用 自然 测量 Bo =E(Y, | X, =0) 
(X-X. 称 为 按 总 平均 数 对 中 Bo = Ms, -By (Xj -X..) 
7 ( 即 调整 的 层 -2 平均 数 ) 
(X-X) 称 为 按 组 平均 数 对 中 Bo, = Hy, 
(ME -2 平均 数 ) 


总 采用 其 他 一 些 有 理论 意义 的 不 位 置 选择 ”Bu =E(Y, 1 X, = 所 选 艺 中 心 位 置 ) 


SJ 


分 层 线性 模型 估计 及 


假设 检验 的 原理 
© 估计 理论 
。 假设 检验 
。 本 章 术语 概要 


第 2 章 旨 在 说 明 分 层 线 性 模型 基本 参数 的 意义 。 在 这 一 章 里 ， 我 们 将 介 
绍 这 些 模 型 估计 推断 的 统计 原理 。 通 过 一 系列 简单 的 模型 ,我们 阐明 关键 的 
原理 ， 后 面 的 第 4 章 中 有 与 这 些 原理 相应 的 实际 应 用 例证 。 对 于 更 注重 实用 
的 读者 ， 可 以 直接 先 阅读 第 4 章 ， 并 把 本 章 作为 参考 。 对 于 想 了 解 更 多 技术 
细节 的 读者 ， 本 章 将 为 第 4 章 中 所 用 到 的 整个 统计 原理 提供 一 个 非常 有 用 的 
背景 。 


估计 理论 


在 一 个 两 层 模型 中 ， 可 以 分 析 三 种 类 型 的 参数 : 固定 效应 、 随 机 的 层 -1 系 
数 ， 以 及 方差 协 方差 成 分 。 事 实 上 ， 每 一 种 参数 的 估计 都 依赖 于 其 他 的 参数 。 
然而 为 了 说 明基 本 原理 ， 我 们 首先 在 假定 方差 协 方差 成 分 为 已 知 的 情况 下 考虑 
对 固定 效应 和 随机 系数 的 估计 。 然 后 ， 我 们 再 考虑 方差 协 方差 成 分 本 身 的 估 
计 。 第 14 章 将 对 全 书 所 用 的 估计 理论 及 计算 方法 进行 更 为 严谨 的 介绍 。 
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固定 效应 的 估计 


我 们 考虑 三 个 简单 模型 的 固定 效应 估计 。 首 先是 单 因素 随机 效应 方差 分 析 
模型 。 它 只 包含 一 个 固定 效应 ， 即 总 均值 ， 通 过 对 /了 个 层 -2 单位 的 样本 均值 
进行 优化 加 权 平均 可 以 得 到 这 个 总 均值 的 估计 。 其 次 ， 我 们 考察 以 均值 作为 因 
变量 的 模型 ， 它 包含 了 一 个 层 -2 回归 系数 。 同 样 地 ， 应 用 优化 加 权 原 理 得 到 
其 估计 。 最 后 ， 我 们 考虑 随机 系数 回归 模型 。 尽 管 将 再 次 用 到 优化 加 权 原 理 ， 
但 这 里 的 加 权 涉及 多 元 情况 ， 因 而 天 要 用 矩阵 表达 。 对 于 那些 不 熟悉 算 阵 表达 
的 读者 来 说 ， 前 两 个 示例 已 经 足以 说 明 估 计 的 基本 思路 。 

单 因素 方差 分 析 : 点 估计 。 与 第 2 章 相似 ， 我 们 从 单 因素 随机 效应 方差 分 
析 开 始 。 回 想 方 程 2.6 中 的 层 -1 模型 : 

Y, = By +r, [3.1] 


对 于 所 有 层 -1 i=l, =, n, URE -2 单位 j=1,，…，J， 我们 假定 其 
残 差 项 服从 正 态 分 布 且 均 值 为 0、 方 差 相 等 , Mr ~N(O, o°), 

对 学 校 j 内 全 部 n, 个 观测 取 平均 产生 一 个 以 样本 均值 为 因 变 量 的 层 -1 
模型 ; 


Y, = By +7, [3.2] 
其 中 : 

r= — 
方程 3. 2 表明 样本 均值 了 ., 是 学 校 平均 数 真 值 (By) 的 一 个 估计 。 估 计 的 误差 
是 7.,， 其 方差 为 : 


Var(7,) =o'/n, = V, [3.3] 
j i 4 d 


我 们 将 V, 称 为 误差 方差 (error variance), ， 即 作为 Bu 估计 的 了 .的 方差 。 
层 -2 模型 是 : 
By = Yoo + um [3.4] 


这 里 我 们 假定 ww ~ N(0，rom ) 。 注意 ，rm 是 平均 数 真 值 Bu 关于 总 平均 数 yw 的 
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方差 。 我 们 将 rm 称 为 参数 方差 (parameter variance) 。 
把 方程 3. 4 代入 方程 3. 2 后 就 得 到 关于 7. 的 组 合 模型 : 


Fn + Uy +7, [3.5} 
Y ., 的 方差 由 两 部 分 构成 : 
Varl Y) = Var( uy) + Var(F,) 
= Tæ +¥, 
= SHAE + REHE 
=A, [3.6] 


注意 ， 尽 管 参数 万 差 rm 在 层 -2 单位 间 是 一 个 常数 ， 但 误差 方差 (V,=0°/n) 
却 随 层 -2 各 单位 的 样本 规模 mw 而 变化 。 

如 果 每 一 个 层 -2 单位 都 有 着 相同 的 样本 规模 ， 则 每 -个 Vv, 都 将 等 于 一 个 
共同 的 Y， 而 且 每 个 4 都 等 于 一 个 共同 的 4， 即 4 = rw + Y。 于 是 ，ym 唯 一 
的 、 最 小 方差 的 无 偏 估计 恰好 等 于 了 ., 的 平均 数 ; 


Im = DY [3.7] 


然而 ， 如 果 样 本 规模 不 相等 ， 统 计量 了 . ,将 有 不 同 的 方差 4 = rm +V R 
每 一 个 了 .为 独立 的 yw 的 无 仿 估 计 ， 并 有 方差 4,， 我 们 定义 了 .的 精度 (preci- 
sion) 为 其 方差 的 倒数 ， 即 : 


ME) = ay [3.8] 


于 是 ,假定 A, 已 知 ， 则 yw 唯一 的 、 最 小 方差 的 无 偏 估计 是 一 个 精度 加 权 平 均 
数 (precision weighted average) ; 


x= ey AA an [3.9] 


方程 3. 9 TM BIE Mah R, LIE — AMR fit. 
HE, 4, 必须 已 知 (或 已 估计 ) 才能 计算 yoe ， 但 这 在 等 样本 规模 的 情况 下 却 
并 非 如 此 (见方 程 3.7)。 显 然 ， 精 度 加 权 平 均 的 应 用 要 更 一 般 化 。 当 所 有 的 
精度 都 相等 时 ， 精 度 加 权 平 均 数 (方程 3.9) 简化 为 简单 平均 数 (方程 3.7) 。 
单 因素 方差 分 析 : 区 间 估 计 。?yo 的 精度 是 所 有 精度 的 和 ， 即 : 
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精度 (yw) = Ta,“ [3. 10} 
?7m 的 方差 就 是 其 精度 的 倒数 : 
Varl ym) = (za) i [3.11] 


因此 ，Yw 的 95% 置信 区 间 由 下 式 给 出 : 
95% Cl yw) -iert Ea) [3.12] 


以 均值 为 因 变 量 的 回归 : 点 估计 。 与 第 2 章 的 讲述 过 程 相仿 ， 这 里 我 们 考 
虑 一 种 可 以 通过 层 -2 变量 预测 层 - ! 均值 的 分 析 。 换 言 之 , 层 - 1 模型 保持 
着 方程 3. 1， 而 层 -2 模型 扩展 为 包含 一 个 自 变量 W。 这 样 ， 组 合 模型 (如 方 
程 3.5 的 规范 表述 ) 扩展 为 : 


Y, = Yæ + Yo W, + uo +F) [3.13] 


而 给 定 W, 时 了 .的 方差 为 : 
Var( Y) = te +V=A, [3.14] 


其 中 , Viso'/n,. ER, ERE, A 是 了 HRABIA, MERE W, iY., 
的 条 件 方差 ， 而 且 我 们 再 一 次 假定 uw 和 7, 都 服从 正 态 分 布 。 

如 果 各 组 都 有 相同 的 样本 规模 ， 各 组 的 4) 都 相同 ， 而 且 yw 唯一 的 、 最 小 
方差 的 无 偏 估计 将 是 常规 最 小 二 乘法 (OLS) 的 估计 ， 


Dew, - WF, - 7) 


Yo Tm — [3.15] 
其 中 : 
W.= SW/ 和 Yr. = VV 
Ym 的 常规 最 小 二 乘 估计 是 : 
Foo = Y.. - Yo W, [3.16] 


然而 ， 如 果 样 本 规模 m 不 相等 ， 统 计量 了 ., 将 有 着 不 同 的 方差 A) = rm + Vo 
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在 这 种 情况 下 ， 假 定 每 一 个 4, 都 为 已 知 ，yo 唯一 的 、 最 小 方差 的 无 偏 估计 就 
是 加 权 最 小 二 乘 估 计 ， 其 中 每 组 的 数据 都 按 其 精度 4” 等 比例 加 权 : 


Em- W)C, - 4) 





cm hance [3.17] 
这 里 ， WAY. 也 都 是 精度 加 权 平 均 数 : 
W = Yaw ya? [3. 18a] 
r= Yay y a; [3. 18b] 
?yo 的 加 权 最 小 二 乘 估 计 是 : 
Yoo = Vo -ia We (3.19) 


以 均值 为 因 变 量 的 回归 : 区 间 估 计 。 在 给 定 4i 的 情况 下 ， 统 计量 7 的 抽 
样 方差 是 : 


Var( Fu) = [ Paw- wy] [3.20] 


FE, Yo) BY 95% 置信 区 间 为 : 
95% Cl yo) = Fo + 1.96[ Var( Yo) °? [3.21] 


更 一 般 的 模型 : 点 估计 。 从 这 些 基本 原理 到 更 一 般 情形 的 扩展 是 直观 
的 。 带 有 O 个 自 变量 的 一 般 化 层 - 工 模型 可 以 用 和 矩阵 的 形式 表示 如 下 : 


Y, = XB +r, r, ~ N(0,0°l) (3. 22) 


RE, Y 是 一 个 nx1 的 因 变 量 向 量 ，X; 是 一 个 由 x(Q+1) 的 自 变量 和 矩阵 ， 
BB 是 一 个 (Q +1) x1 的 待定 参数 向 量 ，I 是 必 xn, WAM, Tr, Æ n xl 
的 随机 误差 向 量 ， 并 假定 其 服从 正 态 分 布 ， 有 均值 向 量 为 90、 方差 协 方差 矩阵 
的 所 有 对 角 线 元 素 都 为 mw-  、 其 他 元 素 孝 为 0。 

假定 X 的 Q+1 FM, W B, 的 OLS 估计 为 : 


O ”这 个 部 分 需要 一 些 关于 矩阵 代数 的 某 础 知识 ， 因 而 可 选择 略 过 。 
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B, = (XTX) XTY, [3.23] 


MHR ERE (dispersion matrix) 为 : 
Var(B,) = V, = 0° (X'X,) * [3.24] 

用 (XIX) X] 左 乘 方 程 3. 22 得 到 求 B 的 模型 : 

B =B+e, ©~NO,V,) [3.25] 
这 里 ，V, 是 误差 方差 和 矩阵， 表示 B 的 估计 B, 的 误差 离散 程度 。 

在 层 -2 模型 中 ，B, 的 一 般 化 模型 为 : 

B =Wy+u, u, ~ N(0,T) (3. 26] 
RE, We (Q +1) xP HAREM, y EF xi 的 固定 效应 向 量 ，u 是 
(Q+1) xl 的 层 -2 误差 向 量 或 称 随机 效应 向 量 ， 而 T 是 任意 (Q +1) x(Q+ 
1) 的 方差 协 方差 矩阵 。 注 意 ，T 是 残 差 的 方差 协 方差 矩阵 ， 表 示 B 关于 其 期 
望 值 Woy 的 离散 程度 。 和 矩阵 W, 包含 了 Q+1 行 自 变 量 向 量 ， 而 自 变 量 向 量 以 
对 角 线 元 素 的 形式 出 现 。 这 个 矩阵 中 的 每 一 行 都 对 应 着 层 -2 模型 中 O + 1 个 


因 变 量 Bu 中 的 一 个 (方程 3. 86 提供 了 W, 为 子 阵 对 角 线 元 素 的 简单 示意 ) 。 
把 方程 3. 26 代入 方程 3. 25 得 到 一 个 组 合 模型 ; 


b, = Wytu,+e, [3.27] 
这 里 ， 在 给 定 W, Ot, B 的 方差 为 ; 


Var(B) = Var(u, +e) =T +V, = A, 
= 参数 方差 + 误差 方差 [3.28] 


如 果 数 据 完全 平衡 ， 即 每 组 有 相同 的 观测 数 ， 并 且 变 量 矩阵 X 的 值 都 相 
等 ， 以 及 B 的 每 一 个 元 素 都 有 一 套 相 同 的 层 -2 自 变量 ， 那 么 每 一 个 色 都 会 
有 相同 的 方差 A， 即 ; 


A=T+V =T+o0'(X'X)" [3.29] 


对 于 这 种 情况 ，Y 唯一 的 、 最 小 方差 的 无 偏 估计 就 是 OLS 回归 估计 : 
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了 = ( Eww) we, [3.30] 


然而 ， 如 果 数 据 不 完全 平衡 ， 不 同 组 的 A 将 存在 差异 。 而 且 假 定 每 一 Ai 已 
m, Y 唯 一 的 、 最 小 方差 的 无 偏 估计 将 是 广义 最 小 二 乘 估 计 (CLS) : 


y= ( Ewa'w,) É Ewah, [3.31] 


这 个 GLS 估计 用 相应 的 精度 矩阵 A? (BU 2 I E PERSIA) 对 各 组 数据 
进行 加权。 请 注意 ,在 以 均值 为 因 变 量 的 模型 中 ， 广 义 最 小 二 乘 估计 与 加 权 最 
小 二 乘 估计 (方程 3.17) 之 间 十 分 对 称 ; 而 且 在 方程 3. 22 和 方程 3. 26 有 正 
态 性 假设 下 ,方程 3.31 也 是 Y 的 最 大 似 然 估计 。 

更 一 般 的 模型 ; 区 间 估 计 。Yy 的 置信 区 间 基 于 V, ( 即 y 的 方差 矩阵 ) ， 方 
程 为 : 


-1 
V; = var( = (Ewa'w,) [3. 32] 


例如 ， 对 某 一 特定 元 素 ， 比 如 y, 的 95% 置信 区 间 由 下 式 给 出 : 


95%CI(y) = Ja 1.960 Va)? [3.33] 


Hh, Vi AE V; 的 第 h 个 对 角 线 元 素 。 

RH, PHAR (方程 3.31) 和 V; 的 公式 (方程 3.32) 虽然 在 解释 方 
面 很 有 用 ， 但 在 实际 应 用 中 却 有 很 大 局 限 。 具 体 而 言 ， 它 们 需要 的 条 件 为 : 
(a) 所 有 层 - 工 系数 都 是 随机 的 ; (b) 每 一 个 层 -2 单位 都 得 有 足够 的 样本 以 
求 出 OLS fiit B, (方程 3.23)。 

这 两 个 条 件 都 可 以 放宽 。 比 如 ， 考 虑 将 方程 3. 26 代入 方程 3. 22 后 得 到 的 
组 合 借 型 ， 

Y, =XWy+Xu, +r, [3.34] 


注意 ， 所 有 包含 在 X 的 层 -1 变量 都 与 包含 在 Y 中 的 固定 效应 及 包含 在 外 中 
的 随机 效应 相 联系 。 但 是 ， 我 们 可 以 很 容易 地 重 写 这 个 公式 ， 允 许 一 些 层 -1 
变 最 具有 固定 效应 但 不 具有 随机 效应 : 


Y, = X,Wyy+ Zu, +r, (3. 35] 
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方程 3.35 中 ，Z, 是 X, 的 一 个 子 集 ， 即 Z 的 列 中 可 能 包含 那些 具有 随机 效应 
的 层 -1 变量 ,而 在 Xi 中 那些 不 包括 在 Z, 中 的 层 -1 变量 却 只 具有 固定 效应 。 
当然 ， 也 可 能 会 有 一 些 层 -1 变量 只 具有 随机 效应 (因此 只 会 出 现在 Z 中 ) 
而 没有 固定 效应 (从 而 不 出 现在 XX, 中 )。 在 第 6 章 有 一 个 这 样 的 例子 。 此 外 ， 
Y 的 边缘 方差 为 


Var(¥.) = V, = ZTZ + o`l, [3.36] 


其 中 ,1 是 n xn 的 单位 矩阵 。 于 是 转 定 效应 的 广义 二 乘 估计 就 变 成 ; 
| Ewxvixw,) S WX VY, [3.37] 
这 一 估计 的 方差 协 方差 矩阵 为 ; 


J -4 
Var(¥) = (2 wix'v,'xw, } [3.38] 


如 果 Z =X, AX, 满 秩 ， 则 有 : 
NV, = a)" [3.39] 


因此 ， 方程 3. 38 的 一 般 表 达 式 就 可 以 简化 为 方程 3. 32。 推 导 方程 3. 39 的 关键 
在 于 有 和 矩阵 的 恒 等 (Smith, 1973): 


[Var(Y)] = (XTX + °l)“ 
=o -ao Xo XX + T°) Xo? [3.40] 


利用 这 个 恒 等 ， RNA: 
XVX, = @ XK oo XN XN + To XX, 
2 V,' ~ 
= Vi (MSV ET ye] 
= VN TT 
= (T(V,'+T')v,)" 
=(T+V) 
=4' 
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随机 层 -1 系数 的 估计 


在 迄今 为 止 的 示例 中 ， 我 们 建立 了 结果 依赖 于 某 些 系 数 〈( 例 如， 均值 或 
回归 系数 ) 的 层 - 1 模型 ， 而 这 些 系数 在 层 -2 单位 间 有 所 不 同 。 现 在 的 问题 
是 : 这 些 层 -1 系数 的 “最 优 估计 ”是 什么 ? 

单 因素 方差 分 析 的 情况 : 点 估计 。 在 最 简单 的 例子 中 ， 我们 有 方程 3.1 和 
方程 3.4 表示 的 两 层 模型 。 以 均值 作为 结果 的 层 - 1 模型 可 表示 为 ; 


Y, = Bs +r,. 对 任意 的 VW = om 有 7 ~ N(0,V) 
层 -2 模型 为 : 


Bo = Yoo + Mo» uy ~ N(0, 449) 


这 个 模型 提供 了 两 种 可 符 换 的 B。 估 计 。 首 先 ， 基 于 层 -1 模型 ,7., 是 Bu 的 无 
偏 估计 ， 并 有 方差 外。 然而 , yw = Aj'Y,/ 了 47 也 可 以 被 视 为 每 一 个 Bu 的 
共同 估计 。 一 个 贝 叶 斯 估计 Bo (Lindley & Smith, 1972) ， 事 实 上 是 这 两 个 估 
计 “ 最 优 ”的 加 权 组 合 : 

Bi =A, Y + (144) Yo [3.41] 
权 数 A, 等 于 了 ., 对 Bu 的 最 小 二 乘 估计 的 可 靠 性 (Kelley, 1927), BP: 


A, = Var(By,)/Var(¥,) = Tolto + ¥,) 
= {参数 方差 )/( 参 数 方差 + 误差 方差 ) [3.42] 


用 经 典 检验 理论 的 话 来 说 ，Y .是 末 知 参数 B, 的 真 值 的 一 个 测量 值 。 我 们 将 和, 
称 为 可 靠 性 (reliability)， 是 因为 它 度 量 了 真 值 (true score) 或 称 参 数 方 差 相 
对 于 观测 值 (observed score) 或 称 样本 均值 了 . ,的 总 方差 的 比 (ratio) 。 当 (a) 
组 均值 8, 在 层 -2 各 单位 间 存 在 很 大 差异 时 (各 组 具有 相同 的 样本 规模 ); 或 
(b) 各 组 样本 规模 m BRAM, WHE A, 趋 近 于 1。 

当 样本 均值 是 相当 可 靠 的 估计 时 ，pBs 公式 中 的 了 ., 获 得 大 的 权重 。 然 而 ， 
如 果 样 本 均值 不 可 靠 ，B 公式 中 的 总 平均 数 估计 yw 将 得 到 很 大 的 权重 。@ 


D 从 技术 上 说 ,估计 Bu 是 在 给 定数 据 及 方差 o 和 ro 的 情况 下 随机 参数 Bu 的 条 件 后 验 均值 。 
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也 可 以 通过 下 面 两 式 来 理解 加 权 平 均 Bu : 
N= WV + re) [3. 43a] 


1-A = roVt ra) [3. 43b) 


如 上 方程 表明 ， 在 构成 B; 时 ， V RRA, VS REE (V 为 作为 Bu 估 
计 的 Y., 的 精度 ) 。 对 应 于 yw 的 权 数 (1 -A,) 与 zw' 成 比例 ， 后 者 代表 了 参 
数 Bu 围绕 其 中 心 yo 的 集中 程度 。 因 此 ， 作 为 8, 估计 的 了 ., 的 精度 越 高 ， 其 
对 应 的 权 数 就 越 大 。 同 样 ，Bu 越 集中 于 它们 的 中 心 yop。，Ywm 对 应 的 权 数 就 
越 大 。 

我 们 说 加 权 平 均 数 Bu 最 优 是 因为 没有 别 的 估计 有 更 小 的 期 望 均 方 误 
(Lindley & Smith, 1972) .了 WEE, By 偏向 于 yw。 当 Bu 的 真 值 大 于 yw 时 ， 
Bs 将 有 人 负 偏 差 : 当 Bu 小 于 volt, By 将 有 正 偏差 。 然 而， 从 平均 水 平 看 ，B; 
比 任何 其 他 无 偏 估计 (如 Y.,) 都 更 接近 B,。Y., 相 对 于 Bi 的 效率 (efficiency) 
近似 等 于 A;， 它 不 会 超过 100% (Raudenbush,，1988)。 因 为 Bi 把 了 .，“ 拉 ” 
向 yw， 所 以 By, 被 称 为 收缩 估计 (shrinkage estimator), James 和 Stein (1961) 
也 推导 过 类 似 的 收缩 估计 ， 并 证 明了 它们 的 优越 性 。pB; 也 经 常 被 归于 贝 叶 斯 
估计 (Lindley & Smith, 1972)。 当 方差 未 知 且 By 是 基于 把 和 代 人 方程 3.41 而 
得 到 的 情况 下 ， 这 一 估计 又 被 称 为 经 验 贝 叶 斯 估计 (empirical Bayes estimates) 
(Morris, 1983) 。 

单 因素 方差 分 析 : 区 间 估 放 ,基于 VW 可 以 建立 Bu 的 一 个 置信 区 间 ， 在 此 :@ 


V = CV" + to) + C1 A) Varl fo) [3.44] 


i 


因此 ，B, 的 95% 置信 区 间 为 ; 


95% CI By) = By +1.96? [3.45] 


当 方差 ?和 rw 已 知 时 ， 这 一 置信 区 间 是 精确 的 。 然 而 ， 当 这 些 方差 未 知 
时 ， 这 个 署 信 区 间 只 是 一 种 近似 ， 而 且 小 于 本 来 的 置信 区 间 。 如 果 J 不 是 很 大 ， 


中 更 确 态 地 说 ， 这 个 估计 之 所 以 最 优 是 因为 在 给 定数 据 、u” 和 rm 的 情况 下 ， 没 有 其 他 Bu 的 点 
个 计 在 其 条 件 分 布 中 其 有 更 小 的 期 龟 均 方 误 、 
D MEERE, V 是 给 定数 据 ，vz: 和 rm 的 情况 下 Bo, 的 后 验方 差 。 
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则 应 该 谨慎 使 用 这 种 置信 区 间 o T 

以 均值 为 因 变 量 的 回归 : 点 估计 。 设 想 我 们 现在 希望 利用 层 -2 变量 W, 
的 信息 预测 Bu， 那 么 Bw 的 “最 优 估计 ”是 什么 ? 层 - 1 模型 仍然 与 方程 3. 2 
相同 ， 但 层 -2 模型 变 为 : 


Bu = Yoo + Yo W, + uy, uo ~ N(0,7%) . [3.46] 


于 是 ,我 们 又 面临 着 两 种 对 Bu 的 估计 。 首 先是 样本 均值 ， 即 所 = 了 .,; 其 
次 是 给 定 W, 而 得 到 Bo 的 预测 值 : 


Bo; = Yoo + YorW, [3.47] 
我 们 再 次 进行 优化 ， 把 这 两 个 估计 合成 一 个 组 合 估计 : 


Ba = AY, + (1 -A,) (Yo + Fo) W) (3.48) 


Bs 同样 是 经 验 贝 叶 斯 估计 或 收缩 估计 。 然 而 ， 这 里 的 了 ,是 向 预测 值 收缩 而 
不 是 向 总 平均 数 收 缩 。 我 们 称 这 一 估计 为 条 件 收缩 估计 (conditional shrinkage 
estimator) ， 因 为 其 收缩 量 取决 于 外。 对 应 于 了., 的 权 数 仍然 与 其 精度 Y 成 比 
例 ， 但 这 里 对 应 于 预测 值 的 权 数 却 是 与 rw 成 比例 ， 其 中 ro E py 围绕 回归 线 
Yoo + yo 多 的 集中 度 。 这 意味 着 ， 如 果 Bu 的 大 部 分 方差 可 以 被 W 解释 ， 那么 围 
绕 回 归 线 的 残 差 方 差 rw 将 会 较 小 。 因 此 ，B, 围 绕 回归 线 的 集中 度 ro 将 会 很 大 。 
与 经 验 贝 叶 斯 估计 Bu 相对 应 的 是 经 验 贝 叶 斯 残 差 (empirical Bayes residual) 
uw 。 这 是 基于 层 -2 模型 关于 Bs 与 其 预测 值 之 间 离 差 的 估计 。 就 方程 3. 45, 
我 们 有 : 
uy = Bi -Yo ~ YoW, [3.49] 
LRA Bb Ek He RS A) — OHH (least squares residual) uw 进行 
比较 。 后 者 是 Bu 的 OLS 估计 偏离 其 基于 层 -2 模型 的 预测 值 的 离 差 估计 。 这 
一 估计 为 ; 


aie ya [3.50] 


中， 这 种 表面 较 小 的 置信 区 则 问题 在 应 用 MLF 方法 时 变 得 更 为 严重 ， 在 MLF 中 yw 也 是 假定 已 知 
的 ， 因 此 VW = CV! rg!) ' 不 能 调整 作为 yoo 估计 的 yom 中 的 不 确定 性 。 
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很 容易 看 出 ，us 是 如 向 0“ 收 缩 ”的 一 个 值 : 
ue = Ni [3.51] 


这 里 ， 如 果 可 靠 性 A, hy 100% ,那么 就 没有 “收缩 "。 相 反 ， 如 果 A; =0, R 


完全 地 收缩 到 其 预测 值 (比如 方程 3. 45 ) 。 
以 均值 为 因 变 量 的 回归 : 区 间 估 计 。Bu 的 置信 区 间 可 以 基于 ”和 预测 值 
W 来 构建 ， 其 中 : 


Vi = (VM) + ry) + (1 A) [Var(yo + Yo W,)] {3. 52] 


ri 


因此 ，pBs 的 95% 置信 区 间 由 下 式 给 出 : 
95% Cl By) = By, * 1. 96¥7'* [3.53] 


与 单 因素 方差 分 析 的 情形 相同 ， 当 了 很 小 时 这 个 置信 区 间 将 会 显得 较 短 。 
更 一 般 的 模型 : 点 估计 .我 们 再 次 把 收缩 的 基本 原理 用 于 方程 3. 22 和 方 
程 3. 26 所 表示 的 模型 。 我 们 的 目的 是 找到 B 的 最 优 估计 。 同 样 ， 我 们 面临 着 


两 种 选择 : 第 一 个 估计 是 简单 的 基于 组 了 数据 的 OLS 回归 估计 名: 


B, = (X/X,) OGY, [3.54] 


第 二 个 估计 是 在 给 定 由 W, 代表 的 组 特征 条 件 下 的 B 的 预测 值 ; 


B, = Wy [3.55] 


其 中 ，Y 由 方程 3.31 所 示 的 GLS 方法 进行 估计 。 


这 两 个 估计 量 的 优化 组 合 
Bo = AB, + (I-A) Wy [3.56] 
其 中 : 
A, = T(T+V,)" (3.57] 


是 BB 的 参数 离散 矩阵 (FT) SR 的 总 离散 矩阵 之 比 ， 后 者 既 包 含 误差 方差 ， 


D 这 个 部 分 需要 一 些 关于 和 矩阵 代数 的 基础 知识 ， 因 而 可 选择 略 过 , 
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也 包含 参数 方差 ( 即 下 + Vi). 我 们 把 A, 视 为 多 元 可 车 性 矩阵 (multivariate 
reliability matrix), MAZ., EA pB 的 估计 ，B 的 可 靠 性 越 大 ， 在 B” 的 构 
成 中 所 占 的 相应 权重 就 越 大 。 如 果 BARAT, p HEB 拉 向 WI EE, 
在 一 般 情况 下 ， 这 个 收缩 是 完全 多 元 的 。 因 为 协 方差 可 能 既 存 在 于 误差 方差 矩 
阵 中 ， 也 存在 于 参数 方差 矩阵 中 ，B 和 W,y 中 的 所 有 0 + 1 个 元 素 联合 起 来 共 
同 估计 B” 的 每 一 个 元 素 。 结 果 是 ， 层 ~ 1 随机 系数 的 一 个 优良 估计 将 有 助 于 
改进 其 他 精度 较 差 的 层 -1 随机 系数 的 估计 。 

更 一 般 的 模型 : OLS 层 -1 系数 的 可 靠 性 。T 和 Vi 的 对 角 线 元 素 ， 分 别 用 
rw 和 ww 来 表示 ， 可 以 用 于 为 0+1 个 OLS 层 -1 系数 的 每 一 个 构造 可 靠 性 指 
数 。 类 似 于 方程 3. 42， 


reliability By) = ruj(ru tey) 9=0.,0 [3.58] 


因为 一 般 说 来 ，B, 的 抽样 方差 rw 在 / 个 单位 间 是 不 同 的 ， 所 以 每 个 层 -2 单位 
都 有 各 自 的 一 套 可 靠 性 指数 。 所 有 I 个 层 -2 单位 的 总 的 可 靠 性 可 以 概括 为 : 


reliability(B,) = + rwv(rorow)， Gg =O. [3.59] 
yet 


需要 明确 指出 ， 方 程 3. 59 不 同 于 方程 3. 51 中 A 的 对 角 线 元 索 。 

更 一 般 的 模型 : 残 差 估计 。 对 每 一 层 的 残 差 估计 在 评价 模型 的 充分 性 假定 
( 见 第 9 章 ) 时 非常 有 用 。 层 -2 残 差 的 OLS 估计 是 层 -1 系数 8 的 OLS 估计 
的 函数 ， 因 而 只 有 在 数据 为 满 秩 的 单位 中 才 存 在 。 于 是 ， 我们 有 : 


ú =B -Wọ [3.60] 
层 -2 的 经 验 贝 叶 斯 残 差 为 : 
uy =B -Wy [3.61] 
对 每 一 个 单位 j 都 存在 。 

与 层 -2 残 差 类 似 ， 层 -1 残 差 可 以 通过 最 小 二 乘法 或 经 验 贝 叶 斯 法 进行 
估计 。 这 些 估计 在 检验 层 - 1 数据 的 分 布 假设 上 很 有 用 。 当 然 ， 最 小 二 乘法 的 
残 差 只 有 在 层 -2 单位 有 满 秩 矩 阵 X, 的 情况 下 才 存 在 。 用 方程 3.35 中 的 一 般 
模型 来 表述 ， 最 小 二 乘法 的 残 差 估 计 为 : 
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PXIWY-2ZI8 [3.62] 
这 里 ，X; 和 Z; 分 别 包含 着 X MZ 的 第 i 行 元 素 。 而 任何 单位 都 有 的 经 验 贝 叶 
斯 残 差 估计 具有 相同 的 形式 : 
r =Y,- XWY- Zlu; [3.63] 


更 一 般 的 模型 : 区 间 估 计 。B 的 置信 区 间 可 以 基于 给 定数 据 的 条 件 方差 协 
方差 矩阵 V” 进 行 构造 ， 其 中 : 


V =(V +T?) +-A)[VarWY)]GE-A)7 [3.64] 


i 


例如 ，B, 的 95% 置信 区 间 为 ; 


95% CI(B,) = By +1.96( Vs) (3.65) 


RE, VV 的 第 y 个 对 角 线 元 素 。 

降 秩 数 据 。 方 程 3. 54 和 方程 3. 56 对 于 阐述 非常 有 用 ， 但 它们 需要 : (a) B, 
的 所 有 元 素 都 是 随机 的 ， 而 且 (b) 每 个 单位 /都 具有 足够 的 数据 允许 通过 
OLS 方法 来 计算 Bo WRG 的 所 有 元 素 的 确 都 是 随机 的 ， 而 层 - 2 单位 ) 却 没 
有 足够 的 数据 计算 B 的 OLS Hit, 那么 其 贝 叶 斯 估计 为 : 


B = (XX +o T?) (XY, + TOWY) [3.66] 


如 果 X, 满 秩 ， 则 Xi; X 可逆， 方程 3.66 将 简化 为 方程 3. 56。 我 们 把 XX, 视 
为 在 组 j 中 包含 的 关于 B 的 信息 。 方 程 3. 66 表明 这 一 信息 是 如 何 由 基于 所 有 
单位 的 T "信息 进行 补充 的 ， 因 此 ， 只 要 T 是非 奇异 的 ，X, Xi + oT 就 可 
递 ， 进 而 允许 对 所 有 层 -2 单位 进行 经 验 贝 叶 斯 估计 。 


方差 协 方 差 成 分 的 估计 


到 目前 为 止 ， 我们 都 假定 方差 协 方差 成 分 为 已 知 。 尽管 这 些 假定 澄清 了 对 固 
定 和 随机 效应 估计 的 理解 ， 但 实际 上 ， 几乎 总 是 要 对 方差 和 协 方差 进行 估计 的 。 

过 去 ， 在 应 用 分 层 模型 时 受到 很 大 局 限 ， 只 有 在 完全 平衡 设计 的 条 件 下 ， 
才 存 在 方差 协 方差 成 分 估计 完备 的 数学 公式 。 为 了 达到 平衡 ,不 仅 每 一 个 层 
-2 单位 都 得 具有 相同 的 样本 规模 ( 对 每 一 个 组 j 有 n; =n)， 而 且 每 一 个 层 -2 
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单位 内 的 自 变量 都 得 具有 相同 分 布 (对 每 一 个 j， 有 XX, = 和 )。 当 设计 不 平衡 时 
(下 如 大 多 数 实际 情况 )， 通 常 必须 应 用 最 大 似 然 法 的 迭代 过 程 来 进行 估计 。 

在 方差 协 方差 估计 问题 上 ， 有 三 个 不 同 思路 的 方法 可 以 使 用 。 它 们 是 : 完 
全 最 大 似 然 法 (full maximum likelihood, MERA MLF) (Goldstein, 1986; Long- 
ford, 1987); 约束 最 大 似 然 法 (restricted maximum likelihood, ， 简 标 为 MLR) 
(Mason et al. , 1983; Raudenbush & Bryk, 1986); 贝 叶 斯 估计 (Bayes estima- 
tion) 。 第 14 章 对 方差 协 方差 的 最 大 似 然 法 估计 进行 了 详细 的 介绍 ( 贝 叶 斯 法 
在 第 13 章 中 有 详细 的 介绍 ) ， 这 里 我 们 仅 限于 对 概念 进行 介绍 。 

完全 最 大 似 然 法 (MLF) 。 对 于 方程 3. 22 和 方程 3. 26 HER y, TA 
的 任何 一 套 可 能 取 值 ， 观 测 到 特定 样本 数据 Y 都 存在 一 定 的 似 然 值 ， 这 里 ，Y 
是 一 个 包含 个 层 - 1 单位 因 变量 的 Wx1 向 量 (注意 : N= Zn;，n; 是 每 一 个 
层 ~2 单位 中 的 样本 数 )。 最 大 似 然 法 的 基本 原理 是 ， 通 过 选择 参数 Y、T 和 
oF 的 估计 值 ， 使 得 观测 到 这 一 实际 数据 Y 的 似 然 值 达到 最 大 。 

基于 这 种 方法 得 到 的 估计 具有 一 些 非常 优良 的 特性 。 在 相当 一 般 的 假定 
下 ， 这 些 估计 具有 一 致 性 (consistency， 即 当 样 本 规模 扩大 时 它们 接近 参数 真 
值 的 可 能 性 也 增 大 ) ,而且 具有 渐 近 有 效 性 (asymptotical efficiency， 即 当 样本 
规模 扩大 时 ， 这 些 最 大 似 然 估 计 向 无 偏 估 计 趋 近 并 且 方 差 最 小 ) 。 另 一 个 优点 
是 ， 如 果 想 估计 这 些 参 数 的 函数 ， 那 么 只 需 简单 地 插 人 这 些 参 数 的 最 大 似 然 估 
计 ， 由 此 得 到 的 函数 本 身 也 是 最 大 似 然 估 计 。 

例如 ， 我 们 曾 在 前 面 提 到 ， 在 带 有 随机 效应 的 不 平衡 的 单 因 素 方差 分 析 
中 ， 当 假定 A 已 知 时 ，yw 估 计 为 : 


入 = 区 4 了/ 


如 果 每 一 4 未知， 可 以 用 4 的 最 大 似 然 估 计 值 蔡 代 ， 得 到 估计 yw 本 身 也 是 最 
大 似 然 佑 计 ， 也 具有 上 述 优良 的 统计 性 质 。 

最 大 似 然 估 计 另 一 个 有 用 的 特性 是 ， 当 样本 规模 增 大 时 ， 它 们 的 抽样 分 布 
将 趋 近 于 正 态 分 布 ， 并 且 其 方差 也 能 够 估计 。 于 是 ， 虽 然 MLF 估计 的 方法 是 
个 选 代 过 程 〈 因 为 没有 完备 的 分 析 表达 式 可 供 使 用 ) ， 其 估计 的 大 样本 分 布 也 
可 以 得 到 很 好 的 定义 。 i 

约束 最 大 似 然 法 (MLR), MLF AY — AKR By HE Ar 2 b i A a F en 
定 效应 的 点 估计 。 考 虑 一 个 简单 的 回归 模型 ; 
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Y, = By +B, X,, + BX, + +BoXo +7, [3.67] 


Hh, REM, i=l, …，n， 服 从 均值 为 0、 方 差 为 常数 o 的 正 态 分 布 。 
暂时 假定 @Q+ 1 个 回归 系数 p。，B,，…, By 为 已 知 ， 则 er 的 最 大 似 然 估 计 
将 为 : 


= Dem [3.68] 


现在 假定 回归 参数 未 知 (这 才 是 通常 情况 ) ， 需 要 进行 估计 。 其 残 差 将 为 ， 
=F-B -BX -BX,-. -bk 13.69] 
其 中 ， 每 个 有 ,都 是 OLS 估计 。 在 这 种 情形 中 ， 通常 o? 的 无 偏 估计 为 
a = Pi/(n-0-1) {3.70} 


注意 , 分母 (n -0 -1) 校正 了 估计 0 +1 个 回归 参数 时 的 自由 度 。 由 于 0 通 
常 比较 小 ， 所 以 这 一 校正 的 影响 也 很 小 了 然而 ， 随 着 0 MRK, EASE 
3.68 估计 o 时 会 导致 严重 的 偏差 。 这 一 偏差 为 负 值 ， 因 此 ez 估计 值 将 会 过 
小 ,由 此 错误 地 导致 置信 区 间 显 得 过 罕 和 假设 检验 显得 过 于 显著 。 方 程 3. 68 
和 方程 3. 70 之 间 的 区 别 也 正 是 MLF 和 MLR 的 区 别 .@ 

对 于 分 层 线性 模型 而 言 ， 基 于 MLF 和 MLR 得 到 的 方差 协 方差 估计 上 的 差 
别 无 法 用 简单 的 代数 公式 来 表达 。 然 而 ，MLR 对 方差 成 分 的 估计 的 确 对 固定 
效应 的 不 确定 性 进行 了 调整 ， 而 MLF 却 没有 。 对 于 两 层 模型 来 说 ，MLR 和 
MLR 对 ”的 估计 结果 非常 相近 ， 但 了 的 估计 却 可 能 存在 明显 的 差异 。 当 层 - 2 
单位 的 数量 J 很 大 的 时 候 ， 这 两 种 方法 会 产生 非常 相近 的 结果 。 然 而 ， 当 / 较 
小 时 ，MLF 得 到 的 方差 估计 7, Stk MLR 的 估计 小 ， 其 倍数 因子 约 为 (J - 
户 )/J， 其 中 下 是 固定 效应 向 量 中 元 素 y 的 总 数 。 

用 EM 算法 进行 ML 估计 的 示范 。 读者 可 能 会 对 如 何 估计 方差 协 方差 的 计 
算 感 到 困惑 。 需 要 解决 的 问题 是 ， 对 层 -1 和 层 - 2 系数 的 估计 需要 方差 成 分 
的 信息 ， 而 方差 成 分 的 估计 又 需要 有 关系 数 的 信息 。 这 种 估计 间 的 相互 依赖 性 


Wo 对 最 小 均 方 误 的 更 好 校正 是 nm- 0+1 而 不 是 na-0-1 

DO 约束 似 然 值 需要 对 全 部 的 仆 续 值 对 y 求 积分 .“ 对 似 然 值 积分 ”是 贝 叶 斯 方法 的 电路， 如 果 我 
BT PALE AB y, è 必 下 的 联合 后 验 概率 密度 ， 那 么 这 -- 方 法 是 有 意义 的 。 约 东 似 然 值 仍然 
可 以 接 经 典 定义 视 为 给 定 阅 的 情况 下 的 条 件 妇 率 密度 。 
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暗示 了 一 些 迭 代 算 法 。 第 一 个 广泛 用 于 分 层 模型 的 是 EM 算法 (Dempster， 
Laird, & Rubin, 1977; Dempster, Rubin, & Tsutakawa, 1981)。 下 面 我 们 示范 应 
用 EM 算法 对 单 因素 ANOVA 模型 进行 完全 最 大 似 然 估计 ， 而 把 对 其 他 算法 及 
更 复杂 模型 的 讨论 留 到 第 14 章 。 为 了 简明 起 见 ， 我 们 去 掉 uy, yo A rm 下 标 
中 的 0。 

EM 基于 这 样 的 思路 ， 即 层 -2 单位 j 的 随机 效应 构成 了 “缺失 值 "， 而 观 
测 数 据 则 包含 了 所 有 层 -1、 层 -2 的 因 变 量 Y;,。 假 定 缺 失 值 u 实际 上 被 观测 
到 了 ， 那 么 对 所 有 参数 (y, r, o) 的 最 大 似 然 估计 就 很 容易 计算 。 为 了 估 
计 y， 我 们 简单 地 把 w, MAS RY, =y + + RA, FE y 的 
OLS 估计 将 为 : 
y= x 0, -wf 


fat ie 


i 


Es [3.71] 
方差 成 分 的 ML 估计 也 很 简单 ， 为 : 

$= ze) [3.72] 
os BE -3 [3.73] 


从 方程 3.71 和 方程 3. 73 可 以 看 出 ， 如 果 缺失 值 给 定 ， 三 个 统计 量 足 以 估计 三 
个 参数 (在 方程 3.71 中 的 合计 以 及 方程 3. 72、3.73 中 的 平方 和 ) ， 这 些 被 称 
为 “完全 数据 充分 统计 基 ” (complete data sufficient statistics ) 或 简称 “CDSS”。 
当然 ,这些 CDSS 不 能 被 观测 ， 因 为 它们 都 依赖 于 缺失 值 w, j=1,，，…，J。 然 
而 ， 在 给 定数 据 Y 及 有 关 参 数 的 初始 推测 时 ，CDSS 可 以 得 到 估计 。 换 言 之 ， 
给 定数 据 Y 及 (y, r”, oP) (其 中 上 标 ” 指 一 个 初始 估计 ) 以 后 ， 每 
D u, 都 服从 均值 为 ww 、 方 差 为 多 ”的 正 态 分 布 ， 其 中 ， 


a = AO CY, ay, ves fh? (1 = al) [3.74] 


Hutt, CDSS 的 估计 如 下 : 


I. & — 
E > 2O; -a)i ay 2 gh) = > RO -u ) [3.75] 
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以 及 
J J 
E| Ye Kyo | = Yu + WD [3.76] 
d a d Š 0 ey? 7 
[EEO -i ny" ron] T YIU, =y - u; Pv) 


[3.77] 


算法 中 计算 “E” 的 这 一 步骤 是 在 给 定 了 及 当前 参数 估计 (方程 3.75 ~3.77) 
的 情况 下 通过 传统 的 数学 期 望 来 估计 CDSS。 而 “M” 步 骤 别 是 把 这 些 估计 的 
CDSS 代入 用 于 给 定 完全 数据 条 件 下 的 ML 估计 公式 (方程 3.71 ~3.73) Po 
Dempster, Laird 和 Rubin (1977) 已 证 明了 EM 算法 中 的 每 一 步 都 会 增 大 似 然 
值 ， 并 且 这 些 估计 将 收敛 于 局 部 最 大 值 。 

前 面 的 公式 站 明了 为 什么 对 于 分 层 模型 而 言 经 验 贝 叶 斯 估计 uw” 和 VV” 的 
EM 迭代 法 是 至 关 重 要 的 。 基 于 Fisher 得 分 算法 的 估计 也 是 EM 分 步 估计 的 函 
数 ， 从 而 也 依赖 于 经 验 贝 叶 斯 残 差 估计 ( 详 见 第 14 章 )。 

基于 最 大 似 然 估 计 的 方差 成 分 的 置信 区 间 。 计 算 包 含 于 矩阵 T 之 内 每 项 
方差 和 协 方差 的 标准 误 估计 是 可 能 的 ， 同 样 ， 对 于 o 的 估计 也 是 可 能 的 。 本 
书 第 14 章 提供 了 在 MLF 方法 和 MLR 方法 中 的 计算 公式 。 然 而 . 还 存在 一 些 
困难 。 关 键 的 问题 在 于 方差 估计 7 的 抽样 分 布 存 在 着 程度 未 知 的 偏 度 。 结 果 ， 
采用 对 称 革 信 区 间 及 其 统计 检验 便 可 能 产生 很 大 的 误导 作用 。 对 这 种 假设 检验 
的 一 种 替代 方法 就 是 本 章 随 后 将 要 阐述 的 内 容 。 

贝 叶 斯 估计 。MLF 和 MLA 都 存在 一 个 弱点 ， 这 一 弱点 可 以 由 贝 叶 斯 方法 
进行 方差 和 协 方差 的 估计 来 解决 。 对 固定 效应 的 推断 ( 即 置信 区 间 和 假设 检 
验 ) 依赖 于 方差 协 方差 参数 的 点 估计 的 准确 度 (accuracy), BUM, FELH fA 
为 因 变 量 的 例子 中 ，yo 的 95% 置信 区 间 是 : 


IHC) = Yor +1.96(V, 7 


mol 


其 中 ， 
Vig, = Var( jo) = [ 4c", - 0 | ‘ 


假定 把 估计 A, = fm V, 代入 这 个 公式 。 如 果 rm 估计 得 很 差 ， 这 个 置信 区 间 可 
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能 会 很 不 准确 。 同 时 注意 ， 使 用 一 个 在 0. 025 水 平 的 正 态 分 布 单位 临界 值 1. 96 
可 能 是 不 准确 的 ， 因 为 只 有 当 V I, o — Yop) (Vig, ) "的 抽样 分 布 才 
是 严格 的 正 态 分 布 。 

Fotiu (1989) 的 模拟 研究 发 现 ， 用 + 分 布 的 临界 值 作 为 一 个 乘 数 能 使 置信 
区 间 估计 更 准确 ， 即 : 


ISPC m) = Yor tt rs (Vio)? 


RE, I REE 号, 公式 中 代入 TaM o’ 的 估计 值得 到 的 。 
与 MLF 和 MLR 不 同 ， 贝 叶 斯 估计 允许 研究 者 不 依赖 于 T 和 oz 的 具体 点 
估计 来 对 Yy 进行 推断 。 使 用 贝 叶 斯 方法 ， 对 y 的 推断 只 依赖 于 给 定数 据 的 后 验 


分 布 @。 有 关 这 个 方法 的 详细 情况 请 参阅 第 13 章 。 
假设 检验 


在 前 面 的 部 分 ， 我 们 讨论 了 三 种 参数 的 估计 : 固定 效应 、 随 机 层 -1 系数 
以 及 方差 协 方差 成 分 。 现 在 我 们 来 考虑 假设 检验 。 

为 了 让 我 们 的 讨论 在 一 个 合理 的 一 般 性 框架 内 ， 先 考虑 一 个 具有 如 下 形式 
的 层 - 1 回归 模型 : 

Ya = By + ByXiy + ByXay + +BoXo + rs 
= By, + AA +r HP. ~ N(0,0*) [3.78] 

方程 3.78 有 CQ +1 个 系数 ， 其 中 任何 一 个 都 可 以 被 视 为 固定 的 ， 或 非 随机 变化 
的 ， 或 随机 的 。 在 层 -2 模型 中 ， 作 为 与 层 -2 的 自 变量 WW,，s =1，…，5, 中 
的 某 一 部 分 对 应 的 每 个 系数 Bu 可 以 由 以 下 模型 表示 ， 


Bu = Yo + Yu Hy + Hye hy to + Ves Ws + Me 


* 
= yo D YWytu [3.79] 
gel 





中 ”这 个 后 验 分 布 是 通过 从 yY，、o* 及 了 的 联合 后 验 分 布 对 o 和 下 求 积分 计算 得 到 的 。 对 任何 特定 
W (o>, T) 但， 都 有 一 个 对 y 及 其 标准 误 的 估计 。 贝 叶 斯 方法 实质 上 是 对 所 有 可 能 的 这 类 估 
计 计 算 加 权 平均 数 ， 其 中 对 应 于 任 一 估计 的 权 数 与 (o? ,个 ) 的 后 验 密度 成 比例 。 
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因为 在 方程 3. 79 中 每 一 个 B。 都 可 能 有 一 套 独特 的 自 变量 ， 所 以 对 每 一 个 B, 有 
S, +1 个 团 定 效应 ， 而 在 层 - 2 模型 中 国定 效应 总 数 FREF (S, +1)。 我 
们 假定 每 一 个 随机 成 分 w 都 服从 多 元 正 态 分 布 ， 于 是 对 任 一 9 都 有 : 


Var(u,) = Tw [3. 80] 
以 及 对 任何 一 对 随机 效应 9 和 9g' 都 有 : 
Cov( ty ty) = Ty (3.81) 


可 以 构造 并 检验 关于 固定 效应 (〈 即 每 一 个 y,) 、 随 机 层 - 1 系数 ( 即 每 一 
个 Bu) ， 以 及 方差 协 方差 参数 的 假设 。 这 些 检验 可 以 是 单一 参数 检验 ， 也 可 以 
是 多 参数 检验 。 因 此 ， 这 里 就 有 6 种 假设 可 以 进行 检验 (如 表 3.1 所 示 )。 通 
常用 于 这 些 模 型 的 相应 检验 统计 其 列 在 表 3. 2 中 - 下 面 将 对 它们 进行 逐一 介绍 
和 示范 。 


表 3.1 分 层 模 型 中 可 进行 假设 检验 的 类 型 





RAR 奖 定 效应 随机 层 -1 系数 方差 成 分 
e — — — 
Hy y 20 By =0 Ty =0 
H, y #0 Bo #0 Tu >0 
多 参数 
Ho Cry=0 Cp=0 TeTo 
H, C'y#0 C'p#0 T=T, 


R32 分 屋 模 型 中 的 通用 假设 检验 





假设 类 型 周 定 效应 随机 层 -1 系数 BRED 
mer 上 检验 4 检验 单 变量 x* 检验 或 : 检验 
多 参数 一 股 线 性 假设 检验 * 一 般 线性 假设 检验 似 然 比 检验 (x*) 


TE: a 似 然 比 检验 也 吕 以 用 于 MEF 模型 


固定 效应 的 假设 检验 


单 参 数 检验 。 在 这 种 情况 下 ， 典 型 的 零 假设 是 : 
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Hs: y, =0 [3.82] 


这 一 假设 意味 着 ， 层 - 2 模型 中 的 自 变量 W, 对 层 -2 模型 中 某 一 特定 的 参数 
B, 没 有 影响 。 例 如 ， 在 第 4 章 中 ,我 们 将 检验 关于 美国 高 中 学 校 的 类 型 (KE 
教学 校 和 公立 学 校 ) 与 学 校 的 平均 成 绩 无 关 的 假设 。 这 样 的 假设 检验 有 以 下 
形式 : 


EEN LA [3.83] 


其 中 ,7 是 7 DRAWA, V E y。 的 抽样 方差 的 估计 。 从 形式 上 说 ，= 
统计 量 是 渐 近 的 标准 正 态 分 布 。 然 而 ， 通 常 一 个 具有 自由 度 为 -5, -1 的: 统 
计量 可 以 为 检验 层 -2 自 变量 的 效应 提供 一 个 更 准确 的 参照 分 布 。 

多 参数 检验 。 现 在 考虑 一 个 将 在 第 4 章 进行 详细 讨论 的 简单 例子 。 在 每 一 
个 美国 高 中 学 校 里 ， 我 们 建立 这 样 的 模型 ， 即 学 生 的 数学 成 绩 作为 学 生 的 社会 
经 济 状况 (SES) 加 上 误差 项 的 函数 ; 


Y, = By, +B,(SES), +7, [3.84] 


其 中 ，Y 是 在 学 校 j 的 学 生 i 的 数学 成 绩 ，(SES), 是 这 个 学 生 的 SES H, rÆ 
随机 误差 ,而 By A pB,, 是 学 校 j 回归 方程 的 截 距 和 和 斜率。 假如 现在 我 们 想 检验 
一 个 合成 的 零 假 设 ， 即 天 主教 学 校 和 公立 学 校 有 着 相似 的 截 距 和 斜率 。 这 是 对 
两 个 假设 同时 进行 检验 。 层 -2 模型 可 以 写成 : 


Bo, = Yon + Ya (SECTOR), + uo [3.85a] 
By, = Yw + Yn (SECTOR), + u, [3. 85b] 


ÈE, (SECTOR), 是 一 个 虚拟 变量 (1 = 天 主教 学 校 ，0 = 公立 学 校 ) 。 待 检验 
的 假设 是 ，yo 和 7 都 为 0。 如 果 这 一 合成 假设 成 立 ，(SECTOR)， 就 可 以 完全 
从 这 个 模型 中 剔除 。 

为 了 理解 这 种 多 参数 检验 方法 ， 需 要 把 方程 3. 85 重新 写成 矩阵 形式 ; 


Yoo 
ps) _ (1 (SECTOR), 0 0 tali (% 
2 i 0 1 (SECTOR), || yo | * | u, [3. 86] 


BD; 
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B, = Wyte, 
这 一 合成 假设 可 以 重新 写 为 : 
H,: C'y = 0 


其 中 ， 


于 是 ,根据 零 假设 ， 有 : 


给 定 已 知 的 Var (B) =A，Y 的 抽样 方差 为 ; 
Var(Y) = ( Ewa'w,) = Vi 
因此 对 比 向 量 (contrast vector) cy 的 方差 为 ; 


Var(CTY) = C'V.C = ( 令 它 为 ) V， 


当 V; 未 知 但 可 以 用 下 式 进 行 估计 时 ， 


V; = (Ewâ'w,) ' 
零 假设 Hy: Cy =0 的 一 个 近似 检验 统计 量 由 下 式 给 出 : 


H = YCV'C'Y 


[3.87] 


[3.88] 


[3.89] 


[3.90] 


[3.91] 


在 零 假设 下 这 一 统计 量 服 从 大 样本 Xx? 分 布 ， 其 自由 度 等 于 要 检验 的 对 比 数目 


( 即 矩阵 CT 的 行 数 ) 。 在 目前 的 例子 中 ，C7 有 两 行 ， 所 以 自由 度 为 2。 


关于 的 多 参数 检验 可 用 于 : 


© 一 个 层 -2 的 分 类 自 变量 与 一 个 B, 间 关系 的 整体 检验 。[ 例如 : 学 校 平 
均 成 绩 与 由 4 个 虚拟 变量 来 表示 的 5 个 区 域 (东北 部 、 东 南部 、 中 西 
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部 、 西 南部 和 太平 洋 海岸 ) 是 否 有 关 ?] 

© 一 个 层 -2 的 分 类 自 变量 的 各 类 型 间 对 比 。( 例 如: 南部 学 生 的 成 绩 与 
中 西部 学 生 的 成 绩 是 否 有 显著 差异 ?) 

。 检验 某 一 层 -2 特征 与 车 十 层 -1 自 变量 中 的 任何 一 个 之 间 是 和 否 存 在 交 
互 效应 。[ 例如 : 学 生 的 社会 经 济 状况 、 少 数 民 族 状 况 或 者 学 业 背 景 对 
学 习 成 绩 的 影响 是 否 依赖 于 不 同 的 学 校 (天 主教 学 校 或 公立 学 校 ) 而 
有 所 不 同 ?] 

。 检验 一 些 层 -2 自 变量 的 子 集 在 某 一 特定 的 B, 模 型 中 是 否 有 必要 。[ 例 
如 : 学 校 的 整体 风气 (包括 学 习 方面 、 纪 律 方面 和 社会 方面 ) 是 否 有 
助 于 预测 学 校 的 平均 成 绩 ?] 


多 参数 检验 还 有 很 多 可 能 的 应 用 ， 其 中 的 一 些 将 在 后 面 的 章节 中 进行 介 
绍 。 多 参数 假设 检验 的 一 个 好 处 在 于 可 以 避免 因 进行 许多 单 参 数 检验 而 导致 第 
一 类 错误 概率 过 高 的 问题 。 统 计 检 验 的 策略 是 ， 只 有 在 相应 的 合成 ( 多 参数 ) 
假设 已 经 被 拒绝 后 ， 再 应 用 事后 (post-hoc) 的 单 变量 检验 。 

另 一 个 进行 多 参数 检验 的 方法 是 似 然 比 检验 。 对 于 固定 效应 ， 这 种 检验 只 
对 MLF 估计 可 行 。 它 基于 估计 并 比较 两 个 模型 的 结果 ， 第 一 个 或 “ 零 ” 
(null) 模型 排除 了 假设 为 零 的 固定 效应 。 第 二 个 或 “ 备 选 ” 模 型 估计 所 有 效 
应 一 一 那些 被 假设 为 堆 的 效应 以 及 其 他 效应 。 对 每 一 个 模型 ， 计 算 一 个 偏差 度 
统计 其 (deviance statistic) ， 在 这 一 统计 基 上 的 不 同 可 以 用 于 检验 多 变量 假设 。 
从 真 觉 上 也 可 以 看 出 ， 这 一 偏差 度 测量 了 模型 的 拟 合 情 况 : 偏差 度 越 大 ， 说 明 
拟 合 得 越 差 。 

在 过 程 上 ， 对 每 一 个 零 模型 我们 计算 偏差 度 D,， 它 是 2 倍 的 负 对 数 似 
然 值 ， 即 ; 


D, = ~ 2log( L,) [3.92] 


其 中 ， 是 在 零 假 设 成 立 的 情况 下 与 最 大 似 然 估 计 相 联系 的 似 然 函 数值 。 类 
似 地 ，D, 是 与 备 选 模型 的 最 大 似 然 估计 相 联 系 的 偏差 度 : 


D, = - 2log(L,) [3.93] 


在 零 假设 下 ,偏差 度 上 的 差异 : 
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D, - D, [3.94] 


具有 大 样本 的 Xx 分 布 ， 其 自由 度 等 于 待定 参数 的 数目 的 差 值 。 这 一 统计 量 的 
较 大 值 说 明 零 假设 是 不 可 信 的 ， 也 就 是 说 ， 零 模型 对 于 数据 的 表达 过 于 简单 。 

似 然 比 检验 将 得 出 的 结果 对 于 方程 3.87 的 一 般 线 性 假设 几乎 是 一 样 的 。 
然而 ， 一 般 线性 假设 有 三 个 优点 : 首先 ， 应 用 一 般 线性 假设 方法 ， 任 何 线性 假 
设 都 可 以 在 只 计算 一 个 模型 ( 备 选 模型 ) 后 得 到 检验 。 相 反 ， 似 然 比方 法 需 
要 重复 为 任何 待 检验 的 零 假 设计 算 估 计 值 。 其 次 ， 一 般 线性 假设 允许 在 各 参数 
间 进 行 任意 的 线性 比较 。 例 如 ， 我 们 可 能 想 检验 两 个 固定 效应 的 差异 或 者 说 是 
这 些 圈定 效应 中 的 线性 对 比 上 的 差异 。 用 似 然 比方 法 进行 这 样 的 检验 需要 重新 
编写 估计 的 算法 ， 以 求 把 参数 间 必 需 的 限制 条 件 考虑 在 内 。 再 次 ， 似 然 比方 法 
在 MLR 中 不 可 用 ， 然 而 如 前 所 述 ， 在 很 多 场合 MLR 估计 都 很 优越 。 

我 们 注意 到 ， 在 应 用 似 然 比 方法 检验 有 关 固 定 效应 的 假设 时 ， 在 零 模型 中 
关于 方差 协 方差 成 分 的 设置 必须 与 备 选 模型 的 设置 保持 一 致 。 如 后 文 将 要 讨论 
的 ， 似 然 比方 法 也 可 以 用 于 检验 与 模型 中 方差 协 方差 成 分 的 结构 相关 的 假设 ， 
以 及 与 固定 效应 和 方差 协 方差 成 分 相关 的 联合 假设 。 


随机 层 -1 系数 的 假设 检验 


沿用 高 中 学 校 研究 的 例子 ， 研 究 人 员 可 能 有 兴趣 检验 这 样 一 个 假设 ， 即 某 
一 学 校 的 回归 系数 为 零 ， 或 者 某 一 所 学 校 的 回归 系数 大 于 另 一 所 学 校 的 相应 回 
归 系 数 。 第 一 个 问题 是 单 参数 假设 ， 第 二 个 则 可 看 成 一 个 多 参数 检验 ， 因 为 它 
是 比较 两 个 或 更 多 的 随机 系数 向 量 的 元 素 。 

单 参 数 检验 。 对 某 一 学 校 特定 回归 系数 的 零 假设 可 以 表示 为 ， 


Hy: By =0 [3.95] 


适当 的 检验 很 类 似 于 固定 效应 检验 的 情况 ， 即 我 们 要 计算 该 系数 估计 与 其 标准 
误 估计 的 比 。 但 是 ， 研 究 人 员 可 以 在 采用 经 验 贝 叶 斯 估计 或 采用 OLS 估计 方 
面 进行 选择 。 

如 果 使 用 贝 叶 斯 估计 ， 则 这 个 比 为 : 


:= 有 /Ia [3.%6] 
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其 中 : 
p 是 经 验 贝 叶 斯 估计 ; 
V JE RM Bu 后 验方 差距 阵 上 的 第 4 个 对 角 线 元 素 ; 
:在 零 假设 为 真 时 近似 服从 标准 正 态 分 布 。 


关于 在 MLF 方法 和 MLR 方法 中 的 后 验 均值 及 方差 的 一 般 表 达 式 将 在 第 14 
章 进行 推导 。 不 过 ， 在 此 应 该 说 明 ， 与 MLF HE, H MLR 得 到 的 后 验方 差 将 
会 较 大 ， 并 且 较 为 实际 ， 尤 其 是 在 层 -2 单位 (如 学 校 ) 的 数目 较 小 时 更 是 这 
样 。 在 MLF 中 ， 由 于 固定 效应 假定 为 已 知 ， 内 此 B, 的 后 验方 差 并 不 反映 其 不 
确定 性 。 而 这 一 假定 只 有 在 层 -2 单位 的 数目 ) 很 大 时 才 较 为 实际 。 

需要 特别 警告 读者 ， 除 非 是 在 当 J 很 大 的 情况 下 ， 否 则 不 管 是 采用 MLF 
方法 还 是 采用 MLR 方法 ， 其 检验 结果 都 不 够 严 诬 ， 以 至 于 其 名 义 显著 度 的 值 
会 大 大 小 于 其 实际 显著 度 的 值 。 此 外 ， 我 们 还 说 不 清 了 必须 要 有 多 大 ， 或 者 其 
统计 检验 的 问题 有 多 大 。 

当 B 的 估计 可 以 通过 OLS 计算 时 ， 存 在 一 个 更 为 保险 的 上: 检验， 在 零 假 设 为 
真 时 它 严格 地 服从 上 分布 。 借 此 ， 可 以 简单 地 对 某 一 特定 层 -2 单位 进行 回归 计 
算 ， 并 按 标准 的 方式 对 其 进行 假设 检验 。 但 是 在 许多 情况 下 ， 层 -2 单位 中 所 含 
的 层 -1 样本 量 很 小 ， 以 至 于 这 一 检验 过 于 保守 而 没有 太 多 的 实用 价值 。 

多 厌 数 检验 。 如 果 我 们 把 B 考虑 为 整个 随机 参数 向 量 ， 即 将 每 个 层 - 2 单 
位 的 参数 列 向 量 依次 登 置 形成 J(Q +1) x1 的 向 量 ， 那 么 关于 B 的 一 般 线性 假 
设 为 ; 


H,: CrB =0 [3.97] 


如 果 经 验 贝 叶 斯 估计 B “被 作为 这 一 检验 的 基础 ， 那 么 其 检验 统计 量 为 : 
Hes = BrCUCTV C) CR" [3.98] 


其 中 ，V "是 所 有 系数 的 J(Q+1) xJ(Q+1) 维 的 整个 方差 协 方差 矩阵 。 在 
MLR 中 ，V "是 一 个 满 秩 和 矩阵 。 也 就 是 说 ， 在 MLR 中 ， 对 不 同 层 -2 单位 的 经 
验 贝 叶 斯 估计 相互 依赖 ， 因 为 它们 都 取决 于 同样 的 固定 效应 的 估计 。 而 在 MLF 
中 ， 对 不 同 层 -2 单位 的 经 验 贝 叶 斯 估计 是 相互 独立 的 ， 但 这 种 独立 却 是 基于 
固定 效应 为 已 知 的 不 太 实际 的 假定 之 上 。 

对 于 某 一 个 层 -2 单位 ， 可 以 直接 采用 MLR 或 MLF 的 经 验 贝 叶 斯 估计 B, 
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来 进行 关于 方差 成 分 的 假设 检验 。 对 于 某 一 部 分 层 -2 单位 进行 系数 比较 也 是 
相对 容易 的 〈 即 只 需要 方程 3. 98 中 一 个 较 小 的 子 阵 ) 。 一 般 说 来 ， 如 果 /不 是 


RA, MLR 和 MLF 方法 都 会 过 于 随意 。 
对 经 验 贝 叶 斯 方法 的 一 个 替代 方法 提供 了 严格 但 却 非常 保守 的 多 元 检验 。 


如 果 OLS 估计 的 整个 向 最 B 能 够 计算 出 来 ， 那 么 方程 3. 97 中 给 出 的 一 般 线性 
假设 可 以 由 下 面 的 统计 量 进行 检验 : 


Has = BTC(CTVE) C'R [3.99] 
其 中 , 立 是 一 个 块 对 角 和 矩阵 ， 其 中 每 一 块 (Q+1)x(Q+l) FERF: 


V = (XN) [3. 100) 
方差 协 方差 成 分 的 假设 检验 


单 参数 检验 。 在 几乎 所 有 分 层 模型 的 应 用 中 ， 研 究 人 员 和 需要 确定 层 - 1 系 
数 是 和 否 应 该 被 设 定 为 固定 的 、 随 机 的 或 非 随机 变化 的 (参见 第 2 章 )。 
为 明确 随机 变化 是 否 存 在 ， 我 们 可 以 检验 一 个 零 假设 : 


Ha: Te =0 [3. 101) 

其 中 ，rw = Var(B,)。 如 果 这 个 假设 被 拒绝 ， 研 究 人 员 可 以 认为 8, 存在 随机 变化 。 

如 果 所 有 (或 至 少 多 数 ) 的 组 都 有 足够 的 数据 计算 OLS 估计 ， 那 么 H: 

Tw =O 可 以 由 一 个 简单 而 有 用 的 方法 来 检验 。 令 六 ,代表 V, = 62(X7X ) -中 的 
Bo 个 对 角 线 元 素 。 于 是 ， 对 于 模型 ， 


By = yo + Brow [3.102] 
有 统计 量 ; 
ó * a 
A — X.v,) fin [3.103] 


它 近似 服从 自由 度 为 《J - S, -1) 的 妇 分 布 。 
对 假设 Hu: rw = 0 的 第 二 种 检验 基于 对 信息 短 阵 求 逆 所 计算 的 ,的 标准 
误 估计 。 根 据 最 大 似 然 估 计 的 大 样本 理论 ， 以 下 比值 ; 
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z= 7,,/{ Var(4,,))'? (3. 104) 


近似 服从 正 态 分 布 。 然而， 在 许多 情况 下 ， 尤 其 是 当 7,, 接 近 0 时 ， 其 正 态 近 
似 性 将 很 差 。 从 技术 上 说 ， 这 时 的 似 然 值 不 可 能 关于 众 数 对 称 ( 即 尚未 取得 
渐 近 正 态 性 ) ， 并 且 按 照 对 称 的 rw 置信 区 间 进 行 检验 非常 有 可 能 是 错误 的 。 

多 参数 检验 。 似 然 比 检验 是 对 方差 协 方差 进行 假设 检验 的 最 一 般 的 形式 ， 
这 种 检验 在 MLF 和 MLR 估计 时 都 可 以 用 。 这 种 检验 经 常用 于 检验 零 假设 : 


H,:T=T, [3.105] 


其 备 择 假设 为 


H,;T =T, (3. 106] 


其 中 ，T ET, 的 简化 形式 。 例 如 ， 假 设 Ti 中 的 第 4 行 和 第 9 列 (或 某 一 部 
分 行 和 列 ) 可 能 为 零 。 对 任何 模型 而 言 ， 其 偏差 度 统计 量 为 -2 ARE ADL IR Om A 
值 的 对 数 相对 其 最 大 值 之 比 〈 详 见 第 4 章 ) 。 为 了 检验 一 个 合成 假设 ， 可 以 先 
估计 两 个 不 同 的 模型 ， 再 对 每 一 个 模型 都 计算 出 其 偏差 统计 量 De 和 D, ， 然 后 
计算 出 这 一 检验 统计 量 : 


H = D, - D, [3. 107] 


这 个 统计 量 服从 自由 度 为 严 的 t, p m 为 这 两 个 模型 中 估计 的 方差 协 
方差 成 分 的 数目 之 差 。 在 应 用 任何 似 然 比 检验 方差 或 协 方差 时 ， 所 比较 的 两 个 
模型 在 其 固定 效应 设置 上 必须 是 一 样 的 。 在 这 种 设置 下 ， 似 然 比 检验 表现 为 一 
定 程度 的 保守 (Pinheiro & Bates, 2000) 。 

最 后 ， 我 们 注意 到 在 方差 和 协 方差 项 的 MLF 估计 中 ， 可 以 同时 对 固定 效 
应 和 方差 协 方差 项 进行 检验 。 这 一 过 程 与 前 面 所 述 是 一 致 的 ， 构 造 一 个 限制 模 
型 并 计算 出 De ， 然 后 用 方程 3. 107 对 比 更 一 般 的 模型 计算 的 D, 来 检验 偏差 度 
统计 量 。 全 部 备 选 嵌 套 模 型 的 拟 合 优 度 都 将 按 这 种 方式 进行 验证 。 第 6 章 示范 
了 这 一 过 程 的 应 用 。 
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一 般 两 层 模型 ; 


Y, = Bo + ByXiy + ByXay + +BoXos + re 
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? 
= By + LB Nw t'y 其 中 , r, ~ N(O,o°) 
Pai 
By = Ya t+ Yu WwW, + res toe + Ye ¥ sy + uy 


= yo + LM, tty 对 任 一 g = 0,…,@ 
4 


我 们 假定 随机 项 u,，g =0，…，0Q， 是 均值 为 0、 方 差 为 Var( us) = rw 的 
多 元 正 态 分 布 ; 并 且 对 于 任何 一 对 随机 效应 9 Ag’, 都 有 Cov(uy ,uwy) = Tyo 
这 些 方差 和 协 方差 成 分 可 以 被 集中 到 一 个 (0 +1) x (O41) 维 的 离散 矩阵 
T 中 。 

精度 : 某 一 个 统计 量 的 误差 方差 的 倒数 

精度 加 权 平 均 数 : 一 系列 统计 量 的 加 权 平 均 数 ， 其 中 每 一 个 统计 量 都 依据 
其 精度 进行 比例 加 权 (方程 3.9) 。 

常规 最 小 二 乘法 (OLS) 估计 : 一 种 使 残 差 平方 和 最 小 的 估计 。 在 单个 
自 变量 的 情况 下 ，OLS 的 斜率 估计 就 是 交叉 乘积 之 和 除 以 一 个 离 差 平方 和 ( 方 
程 3.15)。 

加 权 最 小 二 乘法 (WLS) 估计: 一 种 使 残 差 平方 的 加 权 总 和 最 小 的 估计 。 
在 单个 自 变量 的 情况 下 ，WLS 的 斜率 估计 就 是 交叉 乘积 的 加 权 总 和 除 以 一 个 
离 差 平方 项 的 加 入 总 和 (方程 3. 17) 。 

广义 最 小 二 乘法 (GLS) 估计 : 一 种 使 平方 项 及 交叉 乘积 的 加 权 总 和 最 
小 的 估计 (方程 3.31) 。 

误差 方差 : 未 知 层 -1 系数 (W) 的 估计 统计 量 (如 B,) 的 方差 。 这 
一 方差 包括 几 个 成 分 : 抽样 误差 、 测 量 误差 以 及 模型 误差 (model error) ( 比 
如 对 层 -1 模型 不 完整 的 定义 ) 。 

SRDA: 贯穿 层 - 2 单位 总 体 的 未 知 层 -1 系数 (如 B,) 的 方差 。 

随机 的 层 -1 模型 系数 的 经 验 贝 叶 斯 估计 : 对 某 一 特定 层 -2 单位 的 未 知 
层 -1 系数 所 做 的 估计 。 这 一 估计 不 仅 要 应 用 来 自 这 一 单位 的 数据 ， 而 且 还 要 
应 用 来 自 其 他 类 似 单位 的 数据 (如 方程 3.41、3.48 和 3. 56), 

可 靠 性 : 对 于 两 层 的 分 层 线性 模型 ， 我 们 定义 6 的 可 靠 性 为 这 一 统计 量 
作为 未 知 层 -1 系数 B, 的 OLS 估计 时 的 可 靠 性 。 可 以 为 每 一 个 层 -2 单位 计算 
其 可 靠 性 〈 见 方程 3. 58) ， 也 可 以 为 所 有 了 个 层 -2 单位 计算 总 的 可 靠 性 和 平 
均 的 可 靠 性 (见方 程 3. 59) 。 

无 条 件 收缩 : 通过 与 其 不 可 靠 性 成 比例 的 因子 ， 把 一 个 随机 层 - 1 系数 的 


3 分 层 线性 模型 估计 及 假设 检验 的 原理 65 


最 小 二 乘 估计 向 总 平均 数 收缩 的 原理 。 

条 件 收缩 : 把 一 个 随机 层 -1 系数 的 最 小 二 乘 估计 向 预测 值 ( 而 不 是 总 平 
均 数 ) 收缩 的 原理 。 

层 -2 的 最 小 二 乘法 残 差 (au ) : 最 小 二 乘法 估计 与 其 基于 层 -2 模型 
的 预测 值 之 间 的 离 差 (方程 3.50 和 方程 3. 60) 。 

层 -2 经 验 贝 叶 斯 残 差 (ul); 经 验 贝 叶 斯 估计 B, 与 其 基于 层 -2 模型 的 
预测 值 之 间 的 离 差 (方程 3. 51 和 方程 3.61) 。 

层 -1 的 最 小 二 乘法 残 差 (17,) : 层 -1 因 变 量 多 与 基于 层 -2 模型 固定 效 
应 的 估计 和 最 小 二 乘法 残 差 说 之 间 的 离 差 (方程 3.62) 。 

层 -1 经 验 贝 叶 斯 残 差 (r): 层 - 1 因 变 量 1 与 基于 层 -2 模型 固定 效 
应 的 估计 和 经 验 贝 叶 斯 残 差 u 之 间 的 离 差 (方程 3. 63)。 

单 参数 检验 : 只 涉及 一 个 参数 的 零 假设 检验 。 

多 参数 检验 : 对 涉及 多 个 参数 的 合成 假设 所 进行 的 检验 。 


示 A 


。 介绍 

单 因素 方差 分 析 

© 以 均值 作为 结果 的 回归 

© 随机 系数 模型 

© 以 截 距 和 斜率 作为 结果 的 模型 
© 估计 一 个 特定 单位 的 层 -1 系数 
e 本 章 术 语 概要 


介 g 


本 章 主 要 是 第 3 章 介绍 的 估计 技术 和 假设 检验 的 应 用 示范 ， 以 第 2 章 介 绍 
的 模型 为 基础 进行 一 系列 的 分 析 。 对 于 每 一 个 模型 ， 示 范 园 定 效应 及 其 方差 协 
方差 成 分 的 估计 ， 益 明 这 些 参 数 的 假设 检验 过 程 。 通 过 这 些 例子 ， 还 介绍 一 些 
有 用 的 辅助 性 描述 统计 量 ， 这 些 统计 量 可 以 在 最 大 似 然 方 差 协 方差 成 分 估计 的 
基础 上 进行 估算 。 本 章 的 最 后 一 部 分 将 阐释 随机 层 - 1 系数 的 估计 和 假设 检验 
过 程 。 

下 面 例子 的 分 析 数 据 来 自 美 国 具 有 全 国 代表 性 的 公立 学 校 和 天 主教 学 校 的 
抽样 调查 ， 是 1982 年 高 中 及 以 上 学 校 调查 High School and Beyond Survey, 


HS&B) 的 子 样本 , 包括 160 所 学 校 (90 所 公立 学 校 、70 所 天 主教 学 校 ) 
7185 名 学 生 的 信息 ,平均 每 所 学 校 45 个 学 生 。 
和 (b) 一 个 自 变量 (SES) ,为 学 生 的 社会 经 济 状况 ， 它 是 一 个 父母 受 教育 程 
度 、 职 业 和 收入 的 组 合 变 晤 。 学 校 层次 的 变量 包括 (SECTOR), 和 (MEAN 
SES),， 前 一 个 指标 变量 过 天 主教 学 校 时 峰值 为 1， 闪 公立 学 校 时 赋值 为 0; 后 
一 个 是 每 个 学 校 学 生 的 社会 经 济 状况 均值 。 根 据 第 2 章 引入 的 术语 ， 层 -1 单 
位 是 学 生 ， 层 -2 单位 是 学 校 。 (SES), 是 层 -1 的 自 变 量 ， (SECTOR), 和 
(MEAN SES), 是 层 -2 的 自 变 量 。 表 4.1 列 出 了 这 些 变量 的 均值 和 标准 差 。 

要 分 析 的 主要 内 容 是 : 

1. 美国 高 中 学 校 在 平均 数学 成 绩 上 的 差异 有 多 大 ? 

2. 是 否 社会 经 济 状况 均值 较 高 的 学 校 ， 其 数学 成 绩 也 较 高 ? 

3. 各 学 校 学 生 的 社会 经 济 状况 与 数学 成 绩 的 相关 程度 是 否 相似 ? MAK 
些 学 校 学 生 的 社会 经 济 状况 的 作用 相 比 其 他 学 校 更 重要 ? 

4. 在 控制 了 社会 经 济 状况 均值 (MEAN SES) 后 ， 如 何 比较 天 主教 学 校 和 
公立 学 校 的 数学 成 绩 的 均值 及 其 与 社会 经 济 状 况 之 间 相 关 性 的 强 弱 ? 


表 4.1 美国 高 中 数据 的 描述 性 统计 





变量 名 均值 标准 误 
学 生 层次 变量 g 
数学 成 绩 LAS 12.75 6. 88 
社会 经 济 状况 (SES), 0.00 0.78 
学 校 层次 变量 
FREN (SECTOR), 0.44 0. 50 
学 校 平均 的 社会 经 济 状况 (MEAN SES), 0.00 0.41 

单 因素 方差 分 析 


第 2 章 描述 的 带 随 机 效应 的 单 因素 方差 分 析 ， 为 学 校内 部 和 学 校 之 间 因 变 


0， 可 以 从 美国 教育 部 教育 研究 与 改进 办 公 室 获得 数据 录音 带 和 用 户 手 机。 地址 ; 华盛顿 地 区 新 译 
PEA SS 号 20208 - 1327 。 
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量 的 变化 程度 和 作为 真实 总 体 均值 估计 的 每 个 学 校 的 样本 均值 的 可 靠 性 提供 了 
初步 而 有 用 的 信息 。 
模型 


层 -1 即 学生 层 次 的 模型 为 : 
Y, = By +r, [4.1] 
对 于 学 校 j, j=1，…，160，, 校内 的 学 生 i，i =1，…，n,， 我 们 假定 有 r; ~ iid 
NO, o )®, EXP 为 学 生 层 次 的 方差 。 注 意 ， 这 个 模型 仅 用 一 个 截 距 By 
(在 这 种 情况 下 指 均 值 ) 来 描述 每 个 学 校 的 成 绩 。 
在 层 -2， 丢 学 校 层次 ， 每 所 学 校 的 数学 成 绩 均值 Bu 等 于 总 平均 数 yo 加 
上 一 项 随机 误差 ww: 


By, = Yoo + Uo [4.2] 


这 里 ,我 们 假定 uy ~ iid N(0, Tu), EP rm 表示 学 校 层次 的 方差。 
这 就 产生 了 一 个 组 合 模型 ， 经 常 也 称 为 混合 模型 ， 其 中 含有 固定 效应 yo 
和 随机 效应 uo 和 7,: 


Y; = yo + uy + Ty [4.3] 
结果 


国定 效应 。 在 表 4. 2 中 ， 数 学 成 绩 的 总 平均 数 (使 用 方程 3.9 的 估计 值 ) 
的 加 权 最 小 二 乘法 的 估计 值 为 12. 64， 即 : 
Yoo = 12.64 
其 标准 误 是 0.24， 由 此 产生 的 95% 置信 区 间 (见方 程 3. 12) 可 表示 为 : 


12.64 + 1.96(0.24) = (12.17,13.11) 


O 译注 : 统计 符号 “iid” 或 “i i d. ”表示 “独立 同 分 布 "。 


表 4.2 单 因素 方差 分 析 模 型 的 结果 








同 定 效应 系 数 标准 误 se a= es. 
“学 校 平均 成 绩 的 平均 数 ，ya 12.64 0.24 
随机 效应 By E 自由 度 L — p ffi 
学 校 平均 成 绩 ，xo 8.61 159 1660. 2 0. 000 
KS ~ 1 ROME, r 39.15 





方差 成 分 。 表 4. 2 还 给 出 了 方差 成 分 的 约束 最 大 似 然 估 计 值 。 在 学 生 层次 : 
Var(r,) = 6° = 39.15 


在 学 校 层 次 ，rom 是 真实 的 学 校 平均 成 绩 Bu ( 在 总 平均 数 yw 周围 变化 ) 的 方 
差 。 这 些 学 茨 平均 成 绩 方差 的 估计 是 : 


Var(B,) = Pr(u) = fw = 8.61 


为 了 测量 学 校 间 平均 成 绩 的 差异 幅度 ， 有 必要 计算 这 些 均值 的 可 能 值 区 间 
(plausible values range) ， 在 方程 4. 2 的 正 态 性 假设 下 ， 期 望 学 校 均 值 的 95% 落 
在 以 下 范围 内 : 

Feo £1.96(F0) "7 [4.4] 
所 以 ， 


12.64 + 1.96(8.61)'? = (6.89,18.39) 


表明 这 个 样本 数据 中 学 校 之 间 平 均 成 绩 的 变化 范围 比较 大 。 
我 们 希望 可 以 规范 地 检验 rw 的 估计 值 是 否 显著 地 大 于 0。 如 果 不 是 ， 就 有 
理由 认为 所 有 学 校 具有 相同 的 均值 。 这 一 假设 的 规范 统计 表达 是 : 


Hy: 7a =0 
可 以 用 方程 3. 103 检验 。 这 一 检验 统计 量 将 单 因 素 随 机 方差 分 析 模型 简化 为 : 
H = Daly, -Yu) /0 [4.5] 


它 在 零 假设 下 服从 自由 度 为 -1 的 大 样本 x? 分 布 。 在 我 们 的 分 析 中 ， 这 一 检 
验 统计 量 为 1660. 2， 自 由 度 为 159 (J = 160 所 学 校 ) 。 这 一 结果 表明 ， 零 假设 
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不 太 可 能 (p <0.001) ， 学校 之 间 在 成 绩 上 存在 显著 差异 。 
辅助 统计 量 ， 用 估计 的 参数 方差 代替 方程 2. 10 中 所 对 应 的 参数 ， 以 此 来 
表示 在 了 值 差异 上 学 校 之 间 差 异 所 占 的 比例 ， 又 称 为 组 内 相关 (intraclass cor- 


relation) ; 


P= Fa! (Fog +) = 8.61/(8.61 + 39.15) = 0.18 [4.6 


结果 表明 ， 数 学 成 绩 差 异 的 大 约 18% 是 校 际 之 间 的 差异 。 

与 此 相似 ， 任 何 一 个 学 校 关于 真实 学 校 均 值 Bu 的 样本 均值 可 靠 性 ( relia- 
bility of the sample mean) 的 估计 都 可 以 通过 将 方差 成 分 的 估计 值 代入 方程 
3. 42 得 到 ， 即 : 


A, = reliability(¥,) = Fo/[fw + (im [4.7] 


- 般 而 言 ， 样 本 均值 Y .作为 真实 学 校 平 均 成 绩 估计 的 可 靠 性 会 由 于 样本 规模 
nn 的 变化 而 在 各 学 校 间 变化 。 然 而 ， 可 以 通过 对 各 个 学 校 的 可 和 车 性 取 平 均 数 来 
得 到 可 靠 性 的 整体 测量 : 


A= Daa [4.8] 


对 于 HS&B 数据 ，A =0. 90， 意 味 着 样本 均值 作为 真实 学 校 均 值 是 非常 可 靠 的 。 

总 而 言 之 ， 单 因素 方差 分 析 对 我 们 研究 美国 高 中 学 校 数 学 成 绩 提 供 了 有 用 
的 初步 信息 。 它 提供 了 总 半 均 数 的 估计 ; 将 总 方差 分 解 为 校内 方差 和 校 际 方差 
两 部 分 ; 学 校 均值 的 可 能 区 间 ， 以 及 关于 学 校 差 异 为 零 的 假设 被 验 ;每 个 学 校 
中 观测 值 的 相关 程度 (组 内 相关 ); 还 测量 了 作为 实际 均值 估计 的 学 校 样 本 平 
均 成 绩 的 可 靠 性 。 


以 均值 作为 结果 的 回归 
模型 
方程 4.1 中 学 生 层次 的 模型 保持 不 变 ; 学 生 的 数学 成 绩 被 视 为 在 学 校 平均 


成 绩 的 周围 变化 。 但 是 学 校 层次 的 模型 (方程 4.2) 需要 重新 建立 ， 这 样 才能 
用 学 校 的 社会 经 济 状 况 均 值 (MEAN SES) 来 预测 学 校 的 平均 成 绩 : 


4 示 fil 71 
Bo, = Yoo + Yor (MEAN SES), + ug, [4.9] 


这 里 ，ym 是 截 距 yo, 是 社会 经 济 状 况 均 值 (MEAN SES) 对 Bu 的 影响 ， 并 且 
假定 uo ~ indep.N(0，ro ) 。 

注意 ， 这 里 we 和 ru 的 含义 与 方程 4. 2 中 的 不 同 。 在 方程 4.2 中 ， 随 机变 
量 ww 是 学 校 平均 成 绩 相 对 于 总 平均 数 的 离 差 ， 但 在 这 里 表示 的 是 残 差 Bu - yw - 
Yo. (MEAN SES))。 相 应 地 ， 方 差 rm 在 这 里 是 残 差 方差 ， 或 称 条 件 方差 ， 即 方 
Æ Var(By | MEAN SES) , 指 在 控制 学 校 的 社会 经 济 状况 均值 MEAN SES 后 学 
校 层次 上 B 的 方差 。 

将 方程 4.9 代入 方程 4.1 产生 组 合 模型 (或 称 “ 混 合 模型 " ) ; 


Y, = Yo + Yo (MEAN SES), + ug, +r; [4.10] 


其 中 国定 效应 是 yw 和 yo ， 随 机 效应 是 uo 和,。 
结果 
表 4.3 给 出 了 固定 效应 和 随机 效应 方差 的 估计 和 假设 检验 。 


R43 以 均值 作为 结果 的 模型 结果 














出 定 效应 系 数 标 礁 误 se + 比率 
学 校 平均 成 绩 模 型 。 

RE. Yo 12. 65 0.15 一 

社会 经 济 状况 均值 ，yo， 5. 86 0.36 16.22 

随机 效应 方差 成 分 自由 并 x P 值 
FRE RM, uo 2.64 158 633. 52 0. 000 
RA - 1 RUM, ry 39. 16 





固定 效应 。 我 们 看 到 ， 学 校 的 社会 经 济 状况 均值 MEAN SES 与 数学 成 绩 均 
值 显著 相关 (yo =5.86，:= 16.22)。 用 于 个 人 固定 效应 假设 检验 的 上 值 是 其 
估计 系数 相对 其 标准 误 的 比 (参见 方程 3. 83) : 


t = Yu /[ Var ¥,)]'? = 5.86/0.36 = 16.22 
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还 可 以 检验 总 平均 数 为 零 的 假设 ， 即 Hy: yw =0,， 但 是 在 此 我 们 并 不 关心 这 个 


检验 。 

方差 成 分 。 学 校 间 的 残 差 变 化 (fm =2.64) ER 4. 2 中 随机 单 因素 方差 
分 析 模 型 估计 的 原 值 (7 =8.62) 小 得 多 。 假 定 所 有 学 校 的 社会 经 济 状况 的 
均值 为 零 ， 学 校 均值 的 可 能 值 域 为 ; 


Yo 土 1.96(7m)52 = 12.65 + 1.96(2.64)'? = (9.47,15.83) 


虽然 这 一 可 能 值 区 间 相 当 宽 , 但 也 比 社会 经 济 状况 的 均值 不 为 常数 时 
[参见 方程 4.4, (6.89, 18.39) ] 的 可 能 值 域 小 得 多 。 

控制 社会 经 济 状况 均值 MEAN SES 后 ， 学 校 成 绩 均值 是 否 会 显著 变化 ? 这 
里 零 假 设 rw =0 (rm 现在 是 残 差 方差 ) 由 如 下 统计 量 进行 检验 : 


5 n| Y, ~ fæ - Yo (MEAN ses), } 7a” [4.11] 


在 零 假设 的 条 件 下 ， 这 一 统计 量 服 从 自由 度 为 J-2 =158 的 x 分 布 。 在 本 例 
中 ， 这 一 统计 量 的 值 为 633. 52， 有 p < 0. 001， 表 明 零 假设 被 轻易 拒绝 ， 意 味 
着 在 控制 社会 经 济 状况 均值 MEAN SES 的 情况 下 ， 学 校 之 间 在 数学 成 绩 均 值 上 
还 存在 显著 的 差异 尚未 得 到 解释 。 

辅助 统计 量 。 通 过 比较 两 个 模型 的 rw 估计 值 - 我 们 可 以 获得 一 个 层 -2 
的 方差 削减 比例 (proportion reduction in variance) 的 指标 ， 或 者 称 其 为 “解释 
方差 "， 在 本 例 中 为 : 


7?w( 随机 方差 分 析 ) - Fo (MEAN SES) 
Bo, 中 的 可 解释 方差 比例 = (随机 方 着 分 析 ) [4.12] 


这 里 ,fw (随机 方差 分 析 ) = Var(Bu ) 和 各 (MEAN SES) = Var(,,| MEAN SES) 
分 别 是 由 方程 4.2 和 方程 4.9 定义 的 层 -2 替代 模型 中 rm 的 估计 值 。 注 意 ，7m 
(随机 方差 分 析 ) 是 这 一 分 析 的 基础 ， 因 为 它 代表 了 学 校 成 绩 均值 参数 的 总 方 
差 ， 它 可 以 由 层 -2 替代 模型 中 设置 的 Bu 来 进行 解释 。 由 带 有 社会 经 济 状况 均 
值 MEAN SES 的 模型 所 解释 的 学 校 之 间 差 异 的 比例 为 ; 


(8.61 - 2.64)/8.61 = 0.69 


这 说 明 ， 社 会 经 济 状况 均值 MEAN SES 解释 了 学 校 之 间 数 学 成 绩 实际 差异 
的 69% 。 
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在 排除 学 校 的 MEAN SES 的 影响 后 ， 同 一 所 学 校 中 各 对 成 绩 间 的 相关 性 由 
前 面 的 0. 18 减少 为 : 


P= falia + 0°) = 2.64/(2.64 +39.16) = 0.06 


估计 值 p 现在 是 条 件 组 内 相关 (conditional intraclass correlation) ， 度 量 了 具有 
相同 社会 经 济 状 况 均 值 的 学 校内 部 观测 值 间 的 依赖 程度 。 
类 似 地 ， 我 们 还 可 以 计算 最 小 二 乘 残 差 加 的 可 靠 性 : 


ity, = Y, ~ Yo ~ Yo (MEAN SES), [4.13] 


这 是 一 个 条 件 可 靠 性 (conditional reliability) ， 即 我 们 可 以 通过 这 种 可 靠 性 来 对 
那些 具有 相同 社会 经 济 状况 均值 MEAN SES 的 学 校 进 行 区 分 。 将 新 的 估计 值 
To fl 代入 方程 4.7 和 方程 4.8， 得 到 的 平均 可 靠 性 为 0.74， 与 我 们 的 期 户 
相符 ， 残 差 的 可 靠 性 小 于 样本 均值 的 可 靠 性 。 

总 之 ， 从 以 均值 作为 结果 的 模型 中 ， 我 们 了 解 到 ，MEAN SES 与 平均 成 绩 
之 间 显 著 正 相关 。 但 是 ， 即 使 设 定 MEAN SES 为 常数 ， 即 对 之 进行 控制 后 ， 学 
校 的 平均 成 绩 仍 然 存在 显著 差异 。 


随机 系数 模型 


我 们 现在 来 考虑 160 所 学 校内 社会 经 济 状况 与 数学 成 绩 的 关系 。 我 们 设想 
每 个 学 校 都 有 其 “自身 ”的 回归 方程 ,包括 截 距 和 斜率 。 我 们 将 考察 以 下 的 
问题 : 

1，160 个 回归 方程 的 平均 值 是 多 少 ? ( 即 平均 截 距 和 平均 斜率 是 多 少 ?) 

2. 回归 方程 在 学 校 之 间 的 变化 程度 有 多 大 ?具体 地 说 ， 截 距 的 变化 程度 
有 多 大 ? 斜率 的 变化 程度 有 多 大 ? 

3. 截 距 和 和 斜率 间 的 相关 关系 是 怎样 的 ?[ 即 截 距 大 的 学 校 ( 即 数 学 成 绩 平 
均 分 高 的 党校) 是 否 也 有 大 的 斜率 ( 即 社会 经 济 状况 与 成 绩 之 间 有 强烈 的 相 
关 关 系 )?] 


模型 


我 们 就 第 2 章 介绍 的 随机 系数 回归 模型 来 回答 以 上 问题 。 首 先 建立 层 -1 
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的 学 生 层 次 模型 ; 
)，= By +B(X, - Y,) +r, (4.14) 
每 所 学 校 数学 成 绩 的 分 布 由 两 个 参数 来 描述 : ROE Bo, 和 斜率 B,,， 申 于 学 后 层 
次 的 自 变 世 是 按 学 校 均值 来 对 中 的 ， 所 以 截 距 B, 是 学 校 平均 成 绩 的 结果 ( 参 
匈 方 种 2.29)。 我 们 再 次 假设 7 ~ indep. N(0，a*)， 这 里 ，o 规 在 是 控制 学 
生 的 社会 经 济 状况 后 层 -1 的 残 差 方 差 ， 
参数 B, 和 B, 作 为 总 平均 数 和 随机 误差 的 隧 数 在 层 -2 模型 中 随 学 校 的 变 
化 而 变化 : 
Ba = Yw + um [4. 15a] 
By, = Yot, (4. 15b] 
其 中 : 
Ym 是 所 有 学 校 数 学 成 绩 均值 的 平均 数 ; 
yi 是 所 有 学 校 社会 经 济 状 况 与 数学 成 绩 关 系 的 平均 回归 斜率 ; 
必 是 层 -2 上 与 学 校 j 对 应 的 截 中 上 的 特性 增 量 ; 
u ER -2 上 与 学 校 j 对 应 的 斜率 上 的 特性 增 基 。 
将 方程 4.15 代入 方程 4.14， 得 到 混合 模型 : 


Y, = Ym + vol Vy ~ Xp) tuy tu CX, = X,) +r, [4.16] 


我 们 假定 ww 和 由 ,服从 多 元 正 态 分 布 ， 两 者 的 期 望 值 均 是 0。 我 们 标注 学 
校 效 点 的 方差 为 : 


Var( up) = To 


Var(u,) = Th 
它们 之 问 的 协 方差 为 : 


Govfme sti) = To 


将 它们 表达 成 一 个 方差 协 方差 矩阵 : 


My, To Tor È 
Var 三 2T 14.17] 
Hy To Tn 
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由 于 层 -2 模型 对 于 Bw 和 有 ,来 说 是 无 条 件 模型 (如 ， 方 程 4. 184 和 4. 15b 
中 没有 自 变量 ) ， 在 这 种 情况 下 : 


Varfuw) = Var( By, ~ ym) = Var( By) 
Var(u,) = Var(B, ~- Yo) = Var(B,,) [4.18] 


于 是 ， 随 机 系数 回归 异型 为 随机 截 距 和 和 斜率 这 些 无 条 件 参 数 的 变异 性 提供 
估计 。 


结果 
固定 效应 。 表 4.4 列 出 了 所 有 学 校 的 平均 回归 方程 的 估计 值 。 应 用 方程 
3.31 (或 等 价 的 方程 3. 37) 的 广义 最 小 二 乘 估计 ， 得 到 学 校 平均 成 绩 为 : 
Yo = 12.64 
社会 经 济 状况 与 成 绩 的 平均 斜率 为 : 
Fw = 2.19 


根据 方程 3.32 (或 等 价 的 方程 3. 38)， 相 应 的 标准 误 分 别 为 0.24 和 0.13。 可 
以 用 这 一 信息 检验 零 假设 ， 即 平均 起 来 ， 校 内 学 生 的 社会 经 济 状况 与 数学 成 绩 
没有 相关 关系 ， 即 : 


Ha: Yw =0 
根据 方程 3. 83 的 检验 统计 量 : 
t = (2 = 2.19/0.13 = 17.16 


可 以 看 到 ， 平 均 而 言 ， 在 学 校内 ， 学生 的 社会 经 济 状况 与 数学 成 绩 显著 相关 
(P <0. 001), 

方差 协 方差 成 分 。 应 用 第 3 章 讨 论 的 最 大 似 然 估计 的 一 般 程序 ， 我 们 对 方 
程 4. 17 中 的 方差 协 方差 成 分 进行 估计 : 


| % fo To 8.68 0.04] . 
Var U te A = =T 
uy A 0.04 0.68 
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表 4.4 也 列 出 了 对 应 于 矩阵 T 对 角 线 上 的 每 一 个 方差 为 零 的 假设 检验 统计 臣 
(参见 方程 3.101)， 即 : 


Hi:rw=0 其 中 yg =0,1 


具体 来 说 ,均值 间 的 方差 估计 值 是 Fo =8.68, Hy 统计 量 为 1770.5， 自 由 度 
为 /~-1=159， 然 后 将 其 与 对 应 的 x? 判别 值 比 较 。 由 此 得 出 结论 ，160 所 学 校 
间 存 在 显著 差异 ， 这 -结果 与 带 随机 效应 的 单 因素 方差 分 析 的 结果 很 相似 。 


表 4.4 随机 效应 的 模型 结果 











癌 定 效应 系数 标准 误 se + 比率 
总 平均 数 成 绩 , yo 1264 on = 
HSS AR GM KE RPK. yn” 2.19 0.13 17.16 
随机 效应 Wh 自由 度 x p fi 
学 校 平均 成 绩 ， tg, — 8.68 159 1770.9 0.000 m 
HRP RRE. u, 0.68 159 213.4 0.003 
RE-I A. r 36. 70 





W: a BEABA A TP ODL R 


斜率 方差 的 估计 值 是 7， = 0.68， 对 应 x 的 统计 量 为 213.4， 自 由 度 为 
159, p <0.003, 同样 ， 我 们 拒绝 零 假 设 ， 即 ri =0， 由 此 推断 校内 社会 经 济 
状况 与 数学 成 绩 的 关系 在 学 校 总 体 间 差异 非常 显著 。 

现在 可 以 计算 各 学 校 的 均值 和 各 学 校 的 社会 经 济 状况 与 成 绩 的 斜率 的 可 能 
值 域 。 由 方程 4.4， 层 -1 模型 随机 系数 的 95% 的 可 能 值 域 是 : 


Yo *1.96(7,,)'? [4.19] 
其 中 94=0，…，Q (EAF, Q=1), BARE 95% pE hy OT AERA 
12.64 + 1.96(8.68)'* = (6.87,18. 41) 


社会 经 济 状况 与 成 绩 的 斜率 的 可 能 值 域 为 : 


2.19 + 1.96(0.68)'* = (0.57,3.81) 


学 校 均值 的 结果 与 前 面 单 因素 方差 模型 的 结果 比较 接近 ， 各 学 校 的 社会 经 济 状 


况 与 成 绩 的 斜率 存在 着 较 大 差异 。 就 社会 经 济 状况 的 影响 而 言 ， 最 大 的 学 校 与 
最 小 的 学 校 之 间 差 了 7 倍 多 。 
辅助 统计 量 。 与 B, 和 8B, 相 联系 的 还 有 可 靠 性 估计 (参见 方程 3.59) ， 其 
结果 为 : 
reliability(B,) = 0.91 
reliability(B,) = 0.23 


这 些 指标 回答 了 这 样 一 个 问题 “平均 而 言 ， 如 果 分 别 按 各 学 校 计算 其 最 小 二 
乘法 回归 方程 的 话 ， 得 到 的 各 学 校 截 距 和 斜率 估计 的 可 靠 性 将 如 何 ?” 这 种 可 
靠 性 取决 于 两 个 因素 : 真实 的 内 在 参数 随 学 校 不 同 而 变化 的 程度 ; 每 所 学 校 的 
回归 方程 的 估计 精度 。 

WE (本 研究 中 指 学 校 平均 成 绩 ) 估计 的 精度 依赖 于 每 所 学 校 中 的 样本 
规模 。 斜 率 估计 的 精度 既 依赖 于 学 校 ) 中 样本 规模 的 大 小 ， 又 依赖 于 该 学 校 中 
社会 经 济 状况 的 差异 程度 。 如 果 学 校 中 学 生 的 社会 经 济 状况 具有 同 质 性 ， 会 导 
致 其 斜率 估计 的 精度 很 差 。 

结果 显示 ,平均 每 所 学 校 50 个 学 生 的 样本 规模 使 得 截 距 估 计 的 可 靠 性 很 
高 (0.91) ， 而 斜率 估计 的 可 靠 性 很 差 (0.23)。 和 斜率 估计 的 可 靠 性 较 差 主要 
是 因为 不 同学 校 实 际 斜 率 的 方差 远 远 小 于 实际 均值 的 方差 。 此 外 ， 还 因为 许多 
学 校 在 社会 经 济 状况 方面 有 相当 的 同 质 性 。 

类 似 于 方程 4.12， 可 以 通过 比较 两 个 替代 模型 的 ao 估计 值 ， 来 建立 一 个 
指标 测量 层 -1 方差 消减 比例 或 “解释 方差 "。 注 意 ， 学 生 层 次 的 方差 估计 值 
现在 是 36. 70 ， 而 单 因素 方差 分 析 模 型 (其 中 社会 经 济 状况 SES 并 未 作为 层 -1 
的 自 变量 ) 的 方差 估计 值 是 39. 15， 因 此 ， 

层 -1 MR BIL = Z me 


_ 39.15 - 36,70 
4 39. 15 





= 0.063 [4.20] 


这 里 ，0 (随机 方差 分 析 ) 和 oo (SES) 分 别 指 由 方程 4.1 和 4.11 表示 的 层 - 
1 模型 的 的 估计 值 。 HR. o (随机 方差 分 析 ) 是 本 研究 的 基础 ， 因 为 它 
代表 了 可 被 任何 层 -1 模型 解释 的 总 的 校内 方差 。 

把 社会 经 济 状 况 SES 增设 为 数学 成 绩 的 自 变量 使 得 校内 方差 减少 了 
6.3% 。 由 此 ， 我 们 可 以 得 出 结论 ， 社 会 经 济 状 况 可 以 解释 学 生 层次 因 变 量 方 
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FEY EY 6% - 回想 学 校 的 社会 经 济 状 况 均 值 MEAN SES 可 以 解释 因 变 量 中 校 际 
方差 的 60% 以 上 上 上， 很 明显 ， 学 校 层次 上 两 个 变量 间 的 解释 作用 比 学 生 层 次 上 
的 相应 作用 大 得 多 ， 

最 后 ， 模 型 同时 也 提供 了 截 距 和 和 斜率 之 间 协 方差 的 最 大 似 然 估计 。 结 合 截 
距 和 斜率 的 方差 估计 值 ， 我 们 可 以 应 用 方程 2. 3 估计 截 距 各 斜率 的 相关 系数 。 
本 研究 中 ， 这 一 相关 系数 为 0. 02 ， 表 明 学 校 平 均 成 绩 和 学 校 社会 经 济 状况 两 
个 效应 之 间 几 乎 不 存在 相关 关系 。 


以 截 距 和 和 斜率 作为 结果 的 模型 


在 估计 了 各 学 校 回 归 方 程 的 变异 程度 后 ， 我 们 现在 来 建立 说 明 这 种 变异 的 
解释 性 模型 ， 即 我 们 要 解释 : 为 什么 有 些 学 校 的 均值 高 于 其 他 学 校 ? 为 什么 有 
些 学 校 社会 经 济 状况 与 成 绩 之 间 的 联系 程度 要 高 于 其 他 学 校 ? 


模型 


学 生 层次 模型 与 方程 4. 14 一 样 。 但 是 ， 这 里 ， 我 们 将 学 校 层次 模型 扩展 
为 包括 两 个 自 变 量 : 学 校 类 别 SECTOR 和 社会 经 济 状况 均值 MEAN SES。 所 建 
立 的 学 校 层次 模型 为 ; 


Bo, = Ym + Yo (MEAN SES), + yo (SECTOR), + uy [4.214] 
B, = ye + yu (MEAN SES), + y,,(SECTOR), + u, [4.21b] 


RE, uM ww 依然 服从 多 元 正 态 分 布 ， 均 值 为 0， 方 差 协 方差 矩阵 为 T。T 的 
元 素 现在 为 残 差 ， 或 条 件 方差 协 方差 成 分 。 更 确切 地 说 ， 它 们 代表 了 在 控制 
SECTOR 和 MEAN SES F, By 和 ,的 残 差分 布 。 

组 合 学 校 层次 模型 (方程 4.21) 和 学 生 层 次 模型 (方程 4. 14) ， 得 到 : 


Y, = Yæ + yo (MEAN SES), + yy (SECTOR), 
+ Yul X,- X,) + yu (MEAN SES) (X, - X.) [4.22] 
+ yo (SECTOR), (X, -¥,) + uy +u, (X, ~¥,) +7, 


模型 表明 , 因 变 重 可 以 看 作 总 截 距 (yw) MEAN SES 的 主 效 应 (Yo), SEC- 
TOR 的 主 效应 (yo ) 、 学 生 个 人 社会 经 济 状况 SES 的 主 效应 (ye) 、 两 个 层 间 
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的 交 开 效应 「【 即 SECTOR 与 学 生 SES 的 互动 Cya), DE MEAN SES 与 学 生 
SES (Hah (y,)]， 再 加 上 随机 误差 : 


ty, thl A) tr 


这 一 分 析 可 以 回答 三 个 问题 : 

1. MEAN SES 和 SECTOR 是 否 可 以 有 效 地 预测 截 距 ? 我们 对 yo 的 估计 可 
以 研究 ， 在 控制 SECTOR 后 ， 具 有 较 高 平均 社会 经 济 状况 的 学 校 与 较 低 平均 社 
会 经 济 状况 的 学 校 在 数学 成 绩 均 值 上 是 否 存 在 差异 。 类 似 地 ， 估 计 yo 来 考察 
在 控制 MEAN SES 后 ， 天 主教 学 校 和 公立 学 校 在 成 绩 均 值 上 是 否 存在 差异 。 

2. 用 MEAN SES 和 SECTOR 是 否 可 以 有 效 地 预测 各 学 校 的 斜率 ? 我 们 
(在 控制 SECTOR 条 件 下 ) 对 ya 进行 估计 以 考察 学 校 之 间 在 平均 社会 经 济 状 
况 上 的 差别 是 否 影响 校内 学 生 的 社会 经 济 状况 和 成 绩 间 的 联系 。 通 过 (在 控 
制 MEAN SES 条 件 下 ) 估计 y: 来 考察 ， 天 主教 学 校 和 公立 学 校 在 学 生 的 社会 
经 济 状况 和 成 绩 间 的 关系 上 是 否 存 在 差异 。 

3. 作为 自 变量 的 SECTOR 和 MEAN SES 可 以 在 多 大 程度 上 解释 截 距 和 斜 
率 的 变化 ”为 了 回答 这 个 问题 ， 我 们 估计 Var(uw) =rmw 和 Var(u,) =ru, FFA 
将 其 与 以 上 随机 系数 回归 模型 的 结果 进行 比较 。 


结果 


固定 效应 表 4.5 给 出 了 结果 。 首 先 ， 我们 发 现 ，MEAN SES 与 学 校 的 平 
均 数 学 成 绩 正 相关 ，yY。, =5. 33，t =14.45。 而 且 在 控制 MEAN SES 的 效应 后 ， 
天 主教 学 校 的 平均 成 绩 显著 高 于 公立 学 校 ，Y。, =1.23, t=4.00。 

就 斜率 而 言 ， 显 示 出 MEAN SES 高 的 学 校 的 斜率 高 于 MEAN SES 低 的 学 
Ke, fy, =1.03, 4=3.42。 平均 来 说 ， 天 主教 学 校 的 斜率 显著 小 于 公立 学 
校 ，y = -1.64. t= -6.76. 

图 4.1 显示 了 这 些 结果 ， 分 别提 供 了 天 主教 学 校 和 公立 学 校 的 社会 经 济 状况 
与 数学 成 绩 之 间 关 系 的 拟 合 。 在 各 自 的 拟 合 图 中 : (1) 代表 高 社会 经 济 状况 的 
学 校 (高 于 均值 一 个 标准 差 )，(2) 代表 中 等 社会 经 济 状况 的 学 校 ，(3) 代表 低 
社会 经 济 状况 的 学 校 ( 低 于 均值 一 个 标准 差 )。 这 一 图 形 最 引 人 注 目的 是 天 主 
教学 佼 的 斜率 (校内 社会 经 济 状况 与 成 绩 的 关系 ) 都 远 不 如 公立 学 校 陡峭 ， 
并 由 这 种 类 别 效 应 存在 于 MEAN SES 的 每 个 水 平 上 。 同 时 图 4. 1 还 显示 ， 高 社 
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会 经 济 状况 学 校 的 斜率 比 低 社会 经 济 状况 学 校 的 要 陡峭 ， 这 一 倾向 在 天 主教 学 
校 和 公立 学 校 都 很 明显 ，MEAN SES 和 SECTOR 的 主 效应 也 很 显著 。 图 中 的 实 
线 代表 MEAN SES 的 效应 ， 两 个 图 的 斜率 都 为 正 。 


RAS 以 截 距 和 斜率 作为 结果 模型 的 结果 











间 定 效 点 系数 标准 误 se ! 值 
Tes. — — = 

RIE. Yw 12. 10 0.20 一 

社会 经 济 状 况 均 值 yo 5.33 0.37 14.45 

SECTOR, Yo 1.23 0.31 4.00 
社会 经 济 状 疯 与 成 绩 甘 系 斜率 模型 

MIE. vio 2.94 0.16 一 

社会 经 济 状况 均值 ya 1.03 0. 30 3.42 

SECTOR, yy -1.64 0.24 -6.76 

随机 效应 方差 成 分 A HJE x p i 
学 校 平均 成 绩 . Uo, E 2.38 157 605. 30 0. 000 
HARR GRABER, u, 0.15 157 162. 31 0. 369 
1A -1 RIM, r 36. 68 








学 校 之 间 的 回归 


学 校 之 内 的 回归 “~ 


Set 





天 主教 学 校 类 别 公立 学 校 类 别 
社会 经 济 状况 (SES) 社会 经 济 状况 (SES) 


图 4.1 分 类 别 的 数学 成 绩 对 学 生 及 学 校 社 会 经 济 状况 的 回归 
注 : 学 校 的 《1) (2), (3) 类 分 别 对 应 社会 经 济 状况 (SES) 的 商 、 中 、 低 水 平 。 


第 3 章 讨 论 了 固定 效应 的 多 参数 假设 检验 的 程序 。 比 如 ， 就 公平 性 或 有 效 
性 来 说 ， 天 主教 学 校 与 公立 学 校 的 区 别 可 能 尚未 得 到 证 明 ， 因 此 人 们 可 能 想 知 
道 ， 模 型 中 是 否 需 要 变量 SECTOR。 相 应 的 零 假设 可 写 为 : 


在 控制 MEAN SES 后 ， 如 果 yo =0， 说 明天 主教 学 校 和 公立 学 校 的 平均 成 绩 没 
有 差异 。 与 此 相似 ， 如 果 yn =0， 说 明天 主教 学 校 和 公立 学 校 在 社会 经 济 状 况 
均值 和 数学 成 绩 的 关系 上 无 差异 。 如 果 两 个 零 假 设 均 为 真 ， 那 么 变量 SECTOR 
就 可 以 从 模型 中 删除 。 运 用 方程 3. 91， 计 算得 到 x 统计 值 为 64. 38， 自 由 度 为 
2，P<0.001， 表 明 其 中 一 个 零 假 设 为 假 或 两 个 零 假 设 均 为 假 。 

方 盖 协 方差 成 分 ， 回 想 随 机 系数 模型 的 拟 合 结果 ， 该 结果 提供 了 各 学 校 的 
截 距 和 SES 斜率 的 方差 协 方差 信息 。 现 在 我 们 的 兴趣 在 于 截 距 和 斜率 的 残 差 变 
异 ， 以 及 它们 之 间 的 协 方差 ， 即 SECTOR 和 MEAN SES 不 能 解释 的 变异 。 相 应 
最 大 似 然 点 估计 是 : 


uy fo To 2.38 0.19 
afi) 7 (* | = k 19 0. a [4.23] 
注意 ， 截 距 和 斜率 的 估计 方差 fw 和 Ti， 比 以 上 不 控制 SECTOR 和 MEAN 
SES 时 要 小 得 多 。 这 说 明 ， 在 控制 SECTOR 和 MEAN SES 后 ， 残 差 变异 便 可 能 
变 得 不 显著 。 就 截 距 而 言 , xX 统计 量 为 605. 30， 自 由 度 df =J - S, -1 =157, 
P<0.001， 于 是 零 假 设 Hi: rw =0 被 拒绝 。 因 此 ， 即 使 控制 SECTOR 和 MEAN 
SES 之 后 ， 截 距 上 还 有 很 大 的 差异 尚未 得 到 解释 。 就 斜率 而 言 ,x? 统计 量 为 
162. 31， 自 由 度 df =J - S, -1=157，p <0.369， 于 是 接受 零 假设 H: 7,, =0。 检 
验 表 明 ， 在 控制 SECTOR 和 MEAN SES 后 ， 斜 率 上 已 不 存在 需要 进一步 解释 的 
显著 差异 了 。 
考察 方差 协 方差 成 分 显著 性 的 另 一 种 方法 是 比较 两 个 模型 ， 一 个 模型 包含 
所 关注 的 方差 成 分 ， 而 另 一 个 较 简单 的 模型 则 规定 这 些 成 分 为 零 。 如 果 简 单 模 
型 对 数据 的 拟 合 远 远 差 于 复杂 模型 ， 那 么 有 理由 拒绝 不 能 充分 表达 数据 变化 的 
简单 模型 。 但 是 ， 如 果 两 个 模型 没有 显著 差异 ， 则 简单 模型 更 好 。 将 这 个 逻辑 
应 用 于 当前 的 数据 ， 我 们 来 比较 带 有 随机 截 距 和 斜率 的 模型 与 仅 有 随机 截 距 的 
模型 。 
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“将 截 距 和 斜率 作为 结果 ”的 模型 包括 4 个 特定 的 方差 和 协 方差 参数 : 
(a) 学 生 层次 的 方差 o*; (b) 学 校 平均 成 绩 的 残 差 变化 ，rw; (c) 社会 经 
济 状况 与 数学 成 绩 之 间 斜 率 的 残 差 变 化 ，7,,; (d) 平均 成 绩 与 斜率 之 间 的 残 
差 协 方差 ，7o,。 一 般 而 言 ， 两 层 模型 估计 的 方差 协 方差 参数 的 数量 为 m(m + 
1)/2 +1， 其 中 m 是 层 -2 模型 中 随机 效应 的 数量 。 在 我 们 的 研究 中 ，m =2。 
第 3 章 (参见 方程 3. 105 ~3.107) 描述 了 似 然 比 检 验 的 合成 零 假设 : 


[ Pi 

H,; 

To =0 

先 估计 出 完全 模型 的 4 个 方差 协 方差 参数 ， 再 估计 出 简化 模型 的 两 个 参数 o 
和 ro ) ， 即 规定 了 ru Mr HO. 然后 ， 比 较 两 个 模型 的 偏差 度 (deviance), ， 以 


便 确认 与 复杂 模型 相 联系 的 偏差 度 的 减 小 是 否 合理 。 
就 我 们 的 研究 而 言 ， 其 结果 如 下 : 








模型 参数 的 数量 偏差 度 
简化 模型 ，D。 2 46514.0 
完全 模型 ，D， 4 46513. 1 


偏差 度 减少 了 0.9， 与 具有 自由 度 为 2 的 x 分 布 相 比 没有 显著 差异 。 因 此 ， 看 
起 来 简化 模型 更 为 合理 。 这 说 明 ， 将 SES 与 成 绩 之 间 关 系 斜率 的 残 差 设置 为 随 
机 的 并 没有 增强 模型 的 解释 力 ， 而 将 B,, 设 置 为 非 随 机 变化 的 简化 模型 是 合 
理 的 。 

辅助 统计 量 。 与 方程 4. 12 类 似 ， 我 们 为 层 - 1 模型 的 每 一 随机 系数 ( 截 
HABE) 建立 一 个 方差 前 减 比例 的 指标 ， 或 称 为 方差 解释 比例 。 这 一 指标 
对 比 的 基准 为 前 面 由 随机 系数 回归 模型 估计 的 方差 : 


1.( 随 机 回归 ) - 了 。( 氢 合 模型 ) 
fu( 随 机 回归 ) 





中 的 解释 方差 比例 = [4.24] 
E, i, (MHLE) 表示 随机 回归 模型 (方程 4 14 和 4.15) 估计 的 矩阵 
中 的 第 4 个 对 角 线 元 素 ; a 拟 合 回归 ) 表示 将 截 距 和 斜率 作为 结果 的 模型 
(本 例 中 指 方程 4. 14 和 4. 21) 估计 的 矩阵 工 中 的 相应 元 素 。 





在 本 研究 中 ， 我 们 发 现 ， 一 旦 控制 了 MEAN SES 和 SECTOR， 学 校 平均 成 
绩 的 方差 有 显著 下 降 。 具 体 而 言 ， 截 距 的 无 条 件 方差 曾经 是 8. 68 ， 而 现在 的 
残 差 方 差 是 7o,=2.38， 这 意味 着 ,平均 成 绩 的 参数 方差 Var (By) 中 的 73% 
能 够 用 MEAN SES 和 SECTOR 解释 [ 即 (8.68 -2.38)/8.68=0.73]。 与 此 类 
似 ， 和 斜率 的 残 差 方差 是 7,, =0. 15， 这 一 值 与 无 条 件 方差 值 0. 68 比较 ， 说 明 方 
差 前 减 比例 是 78% 。 很 明显 ， 斜 率 变异 的 大 部 分 与 MEAN SES 和 SECTOR 有 
Xo 一旦 控制 了 这 两 个 变量 ， 仅 有 极 少 的 残 差 方 差 部 分 未 被 解释 。 第 5 章 详细 
讨论 了 考察 解释 方差 的 策略 (参见 “使 用 方差 统计 量 的 削减 比例 ”) 。 


估计 一 个 特定 单位 的 层 -1 系数 


本 章 中 ， 我 们 用 两 个 学 校 别 参数 刻画 每 所 学 校 成 绩 分 布 的 特征 : 学 校 的 平 
均 数学 成 绩 和 描述 SES 和 数学 成 绩 关系 的 回归 系数 。 我 们 将 这 些 层 - 1 系数 看 
作 “ 随 机 参数 ”， 即 这 些 参 数 在 各 学 校 总 体 之 间 有 变化 ， 而 这 些 变化 是 观测 自 
变量 的 函数 。 在 第 3 章 曾 提 到 ， 我 们 可 以 取得 每 一 层 - 1 随机 系数 的 点 估计 和 
区 间 估计 。 从 技术 上 说 ， 这 些 估计 是 经 验 贝 叶 斯 估计 ， 也 称 为 收缩 估计 。 收 缩 
估计 可 以 分 为 两 种 : 无 条 件 收缩 估计 和 条 件 收缩 估计 。 我 们 将 示范 每 一 种 方 
法 ， 并 且 将 之 与 最 小 二 乘法 进行 比较 。 


We |. = RE 


估计 一 个 特定 学 校 的 回归 方程 最 常用 的 方法 是 用 最 小 二 乘法 (OLS) 给 每 
所 学 校 的 数据 拟 合 一 个 模型 。 每 所 学 校 的 模型 就 是 方程 4. 14。 结 合 SES 按 其 
学 校 均值 对 中 ， 得 到 的 截 距 B。 是 该 所 学 校 的 均值 ， 回 归 系 数 B, 代表 该 校 中 
SES 每 变化 一 个 单位 时 成 绩 的 期 望 变化 量 。 只 要 每 个 学 校 至 少 有 2 个 案例 ， 最 
小 “乘法 便 可 以 对 任何 一 所 学 校 求 出 这 些 参数 的 无 偏 估计 。 实 际 上 ， 如 果 模 弄 
的 误差 服从 独立 的 正 态 分 布 ， 那 么 最 小 二 乘法 的 估计 值 就 是 唯一 的 、 方 差 最 小 
的 无 偏 估 计 。 但 是 ， 如 下 所 示 ， 对 于 任何 一 个 给 定 的 学 校 ， 最 小 二 乘法 的 估计 
值 可 能 并 不 是 非常 准确 。 

表 4.6 的 第 1 列 和 第 2 列 给 出 了 HS&B 数据 中 从 160 所 学 校 中 挑选 的 12 
所 学 校 各 自 的 最 小 一 乘 估计 值 。 估 计 值 是 用 方程 3. 54 计算 的 。 根 据 这 些 估计 
值 ， 我 们 可 以 判断 案例 4 是 一 所 非常 好 的 学 校 ， 因 为 它 的 平均 成 绩 很 高 ， 反 ,= 
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16.26， 而 量具 有 平等 社会 的 分 布 模式 ，B,, =0.13。 

图 4. 2a 给 出 了 160 所 学 校 各 自 的 最 小 二 乘法 估计 值 的 标 绘图 。 纵 轴 是 截 
中 估计 值 ， 横 轴 是 斜率 估计 值 。 相 当 多 学 校 的 社会 经 济 状况 与 成 绩 的 关系 出 现 
负 值 ， 而 莫 最 小 二 乘法 估计 值 的 离 差 情况 显著 超出 了 实际 斜率 方差 的 最 大 似 然 
估计 。 先 前 ， 我 们 估计 的 实际 斜率 的 方差 是 0. 68， 但 是 ， 图 4. 2a 用 最 小 二 乘 
法 估计 的 斜率 的 样本 方差 却 是 2.66。 如 果 我 们 定义 有 效 且 公平 的 学 校 为 那些 
具有 较 大 均值 和 较 小 SES 与 数学 成 绩 关 系 斜率 的 学 校 ， 那 么 我 们 可 能 会 判断 许 
多 学 校 与 案例 4 一 样 好 。 


R46 HS&B 数据 的 一 个 抽样 的 层 -1 系数 估计 的 比较 





MVM OPM AIT 经 验 贝 叶 斯 估计 
最 小 二 乘法 估计 





的 无 条 件 模型 的 条 件 模型 

案例 Éy By Be, Bi By B; n, MEAN SES SECTOR 
4 16.26 0.13 15.62 205 1620 1.82 20 0.53 i 
IS 15.98 215 15.74 219 16.01 185 53 0.52 1 

17 18.11 00 74 195 17.25 3.67 29 0.69 0 

22 14 -0.78 14.22 116 1089 0.58 67 -0.62 1 

27 13.40 4. 10 13.32 25 1295 3.02 38 -0.06 0 

5 95 374 9%716 274 95 247 51 -0,64 0 
的 147 618 164 27 1192 306 25 0.08 0 

15 90 L65 928 20 930 07 63 -0.59 1 

81 1542 526 15.25 312 15.52 201 66 0.43 1 

9 1214 19 128 214 1234 301 50 0.19 0 
135 4. 55 025 6.42 1.93 8.55 26 14 0.03 0 
153 10.28 076 1071 207 967 236 19 -0.59 0 





无 条 件 收缩 


一 般 而 言 ， 最 小 二 乘法 回归 估计 的 准确 性 依赖 于 学 校内 样本 规模 m 以 及 
层 -1 ADR 交代 表 的 范围 。 如 果 n 较 小 ， 均 值 的 估计 值 会 不 精确 。 如 果 
一 个 学 校 的 样本 量 太 小 ， 或 者 SES 的 范围 比较 小 ， 斜 率 的 估计 值 后 ,也 会 不 精 
确 。 每 所 学 校 回归 线 的 经 验 贝 叶 斯 估计 (EB) 考虑 到 了 最 小 二 乘法 估计 的 不 
精确 之 处 。 


表 4.6 的 第 3 列 和 第 4 列 提供 了 12 所 学 校 的 EB 估计 值 。 估 计 值 Bs 和 Bi 
以 无 条 件 层 -2 模型 (方程 4.14 和 4.15) 为 基础 ， 应 用 方程 3. 56 (或 等 价 的 
WH 3.66) 计算 得 到 .注意 : 案例 4 的 EB 估计 值 与 最 小 二 乘法 的 估计 值 有 很 
大 差别 。 估计 的 平均 成 绩 下 降 了 0. 64 (从 16. 26 下 降 到 15. 62) ， 而 社会 经 济 
状况 与 成 绩 的 斜率 的 估计 值 从 0. 13 上 升 到 2.05。 尽 管 学 校 总 的 成 绩 水 平 值 保 
持 相对 很 高 ， 但 公平 的 效应 却 消 失 了 。 就 最 小 二 乘法 的 估计 值 而 言 ， 案 例 4 看 
起 来 要 比 案例 15 好 ,但 是 两 个 学 校 在 经 验 贝 叶 斯 估计 值 方面 却 没有 什么 差异 
(Bo, 的 估计 值 分 别 是 15. 62 和 15.74, B 的 估计 值 分 别 是 2. 05 和 2. 19) 。 主 要 
原因 是 案例 4 的 样本 规模 相对 较 小 ， 仅 有 20 个 学 生 。 所 以 ， 这 个 案例 的 最 小 
“乘法 估计 值 不 太 精确 ， 而 经 验 贝 叶 斯 估计 值 向 总 平均 成 绩 ym = 12. 64 和 总 
平均 社会 经 济 状况 与 成 绩 的 斜率 ye =2. 19 收缩 。 注意， 出 现 这 样 的 情况 主要 
是 因为 这 些 案例 (17, 69, 135 和 153) 的 样本 规模 较 小 ， 分 别 是 29、25 14 
#19, 

在 图 4.2b 中 提供 了 160 所 学 校 的 经 验 贝 叶 斯 估计 结果 ， 纵 轴 是 截 距 的 估 
计 值 ， 横 轴 是 斜率 的 估计 值 。 注 意 ， 经 验 贝 叶 斯 斜率 估计 值 比 最 小 二 乘法 估计 
值 (图 4.2a) 更 集中 于 样本 均值 周围 。 不 同 于 最 小 二 乘法 的 斜率 估计 值 ， 贝 
叶 斯 估计 值 中 没有 负 的 。 而 且 经 验 贝 叶 斯 斜率 估计 值 的 样本 方差 仅 有 0. 14, 
远 远 小 于 最 小 二 乘法 的 相应 值 2. 66。 实 际 上 ， 这 一 样本 方差 值 也 小 于 实际 斜 
率 方差 的 最 太 似 然 估 计 值 (0. 68)。 


注意 这 些 结果 中 有 : 

Var(B) > Var(B,) > Varl; ) 

最 小 二 乘法 估计 BL - 1 系数 方 着 的 最 大 似 然 估 经 验 贝 叶 斯 估计 
> > 

的 观测 方 盖 计 , 即 方程 4. 15 中 的 fo ,7 的 观测 方差 


经 验 贝 叶 斯 估计 的 方差 小 于 估计 的 实际 方差 是 我 们 期 望 的 结果 。 总 的 来 
看 ， 收 缩 稍微 扩大 了 一 点 ， 经 验 贝 叶 斯 估计 使 估计 值 离 样本 均值 “ 较 远 ”。 

比较 图 4. 2 中 斜率 收缩 与 成 绩 戴 距 收 缩 的 结果 很 有 意思 。 截 距 是 每 所 学 校 
的 平均 成 绩 ， 其 估计 值 远 比 斜率 估计 值 可 等 (0.91 对 0. 23 ) 。 如 果 斜 率 的 估计 
值 越 精确 ， 我 们 期 望 的 经 验 贝 叶 斯 估计 值 越 依 赖 于 这 一 成 分 ， 即 收缩 越 难 发 
生 。 图 4.2 显示 了 这 一 结果 (比较 图 4. 2a 和 4.2b 的 纵 轴 )。 不 同 于 有 大 量 收 
缩 的 斜率 ， 最 小 二 乘法 与 经 验 贝 叶 斯 法 对 截 距 的 估计 的 差异 并 不 太 大 。 表 4.6 
中 12 所 学 校 的 子 样本 的 结果 也 显示 了 同样 的 模式 。 
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- 般 地 ， 在 随机 截 距 模型 中 的 经 验 贝 时 斯 估计 比 同 时 还 带 有 随机 斜率 的 模 

型 简单 ， 比如， 我 们 重点 考虑 每 所 学 校 的 SES 和 成 绩 关 系 的 斜率 及 其 截 距 。 每 

-部 分 的 经 验 贝 叶 斯 估计 值 依赖 于 其 他 部 分 ， 而 且 两 部 分 之 间 最 大 似 然 估计 值 
的 相关 越 大 ， 这 种 依 束 性 就 越 强 


w) 常规 最 小 二 乘法 (OLS) 


= * eo * 


18.0+ 2 kt 
Deth) + + * 


018 ~ taekek eee) * * 
Aii - * 22 433*4244 & tr 
= ** ⸗»2**6424 ** 
12.0+ 22 *3 #2e2ee2 * 
= * 2422 k kkkt He 2 
* * 22 2% #2 


= * 3242% 


EB 斜率 


图 4.2 160 所 高 中 的 常规 量 小 二 乘法 和 经 验 贝 叶 斯 方法 的 
MESHES 
注 ; MERLE ARRE, HERE R. 
a 符号 +” RRM EEO 个 、 
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条 件 收缩 


提高 B, 和 8B, 估 计 值 准确 性 的 方法 是 条 件 收 缩 。 它 并 不 是 将 最 小 二 乘法 的 
回归 线 “ 拉 ”向 以 yw 和 Yo 为 代表 的 总 平均 的 回归 线 ， 而 是 将 其 “ 拉 ” 向 以 
学 校 层次 模型 为 基础 的 预测 值 . 

随机 系数 回归 模型 (如 方程 4.15) 的 无 条 件 收缩 得 到 : 


=A]. 11+-A)| [4.25] 
B; Bij Yio 


RE, A 以 方程 4. 14 和 4.15 模型 的 ex 和 T 估 计 为 基础 。 与 之 相反 ， 以 截 距 
和 斜率 作为 结果 的 模型 ( 参见 方程 3. 56 或 与 之 等 价 的 方程 3. 66) 产生 的 条 件 
收缩 是 向 着 Bs 和 ,的 预测 值 ， 即 : 


B; bs Yoo + Yo (MEAN SES), + Fo (SECTOR), 
=A f|. {+U-Adlo . AE [4.26] 
B; Ju + u (MEAN SES), + fu (SECTOR), 


Y 


现在 ，Ai 以 方程 4. 14 和 4.21 模型 的 o? 和 全 估计 为 基础 。 

与 无 条 件 收缩 一 样 ， 当 组 内 样本 量 六 比较 小 时 ， 条 件 收缩 的 影响 可 能 非常 
极端 (参见 表 4.6 的 第 5 列 和 第 6 列 ) 。 注 意 ， 案 例 135 的 Bu 和 ,的 最 小 二 乘法 
估计 值 分 别 是 (4.55, 0.25)。 在 无 条 件 收缩 的 情况 下 ， 这 两 个 值 分 别 为 
(6.42, 1.93); 在 条 件 收缩 的 条 件 下 ， 它 们 的 值 分 别 为 (8.55，2. 61 ) 。 在 条 件 
收缩 的 情况 下 ， 案 例 135 的 最 小 二 腰 法 回归 线 接近 Bu 和 ,的 预测 值 ， 而 它们 是 
由 该 所 学 校 的 社会 经 济 状况 均值 (MEAN SES =0.03) 和 学 校 类 别 (SECTOR =0 
为 公立 学 校 ) 预测 的 。 将 这 些 值 代入 表 4. 5 的 估计 方程 得 到 预测 值 为 : 


E(B,,) = 12.10 + 5.33(0.03) +1.23(0) = 12.26 
E(B,) = 2.94 +1.03(0.03) - 1.64(0) = 2.97 


注意 ，pB, 的 经 验 贝 叶 斯 估计 值 8; =2. 61 使 得 最 初 的 最 小 二 乘法 值 0. 25 实际 上 
儿 乎 完全 收缩 到 预测 值 2. 97 。 除 了 案例 135 的 样本 量 较 小 (ns = 14) 以 至 于 
回归 斜率 不 可 靠 外 ， 条 件 收 缩 的 变化 量 还 依赖 于 预测 方程 的 精度 ， 而 预测 方程 
的 精度 又 是 T 中 残 差 方 差 的 函数 。 因 为 Th =0.15， 所 以 本 例 中 预测 方程 比较 
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精确 ， 因 而 收缩 也 比较 大 、 我 们 注意 到 ， 同 样 的 因素 在 Bb 向 Bi 的 条 件 收缩 中 
也 起 作用 。 但 是 ,Bu 的 收缩 比例 比 B, 小 ， 因 为 对 于 n, 的 任何 固定 值 ， 学 校 的 
均值 都 比 斜率 更 可 靠 。 因 为 原始 的 样本 均值 相当 精确 ， 所 以 在 B; 的 估计 中 ， 
经 验 贝 叶 斯 估计 给 了 Bu 相对 较 大 的 权重 。 

表 4.6 还 给 出 了 条 件 收缩 在 各 个 案例 上 的 不 同 影响 。 例 如 ， 比 较 案例 22 
( 低 社会 经 济 状况 的 天 主教 学 校 ) 和 27 (一 般 社 会 经 济 状况 的 公立 学 校 )。 最 小 
:乘法 估计 表明 这 两 所 学 校 在 平均 成 绩 水 平 (11.14 对 13.40) 上 和 社会 经 济 状 
况 与 成 绩 的 斜率 ( -0.78 对 4.10) 上 均 有 很 大 差异 。 而 无 条 件 收缩 显示 ， 大 部 
分 的 观测 差异 “收缩 没 了 "。 但 是 ， 根 据 表 4.6 的 结果 我 们 知道 ， 学 校 的 社会 经 
济 状况 均值 和 学 校 类 别 既 预 测 了 学 校 的 平均 成 绩 水 平 ， 也 预测 了 学 校 的 社会 经 济 
状况 与 成 绩 之 间 的 斜率 。 当 我 们 通过 条 件 收缩 方法 考虑 这 个 问题 时 ， 大 部 分 的 原 
始 差 异 又 出 现 了 ,对 于 B。， 有 10.89 对 12.95; HFE, 有 0.58 对 3 02。 

另 -- 种 有 意思 的 比较 是 学 校 17 和 学 校 81 的 比较 。 两 所 学 校 都 有 较 高 的 社 
会 经 济 状况 ， 而 学 校 17 是 公立 学 校 ， 学 校 81 是 天 主教 学 校 。 两 所 学 校 的 平均 
成 绩 都 比较 高 (By sy) = 18. 11; By gy = 15.42)， 天 主教 学 校 的 斜率 非常 陡峭 
(Bin =5.26) ， 公 立 学 校 则 不 是 这 样 ( 启 ，= 0.09) 。 两 所 学 校 都 是 多 变量 分 
析 的 异常 值 (outlier) ， 因 为 它们 斜率 的 最 小 二 乘 估计 与 数据 中 的 所 有 其 他 信 
息 都 不 一 致 。 也 就 是 说 ， 从 表 4. 5 中 ， 我 们 期 望 社会 经 济 状况 水 平 高 的 公立 学 
校 有 陡峭 的 斜率 ， 而 对 应 的 天 主教 学 校 则 不 是 这 样 。 在 本 研究 中 ， 条 件 收 缩 对 
这 两 个 方程 进行 了 重新 排序 。 尽 管 公立 学 校 的 BS 依然 比较 高 (17.25 对 
15.52) ,但 是 在 条 件 收缩 时 ， 天 主教 学 校 的 社会 经 济 状况 与 成 绩 之 间 斜 率 的 估 
计 值 现在 却 小 于 公立 学 校 (2.01 对 3.67). 

条 件 收缩 的 影响 也 可 以 通过 最 小 二 乘法 和 经 验 贝 叶 斯 残 差 的 应 用 来 识别 
{ 参 见方 程 3. 50、3. 60 以 及 方程 3. 49、3.61) 。 方 程 4.21 REMER H 
小 二 乘 残 差 是 : 


üy = By - [fu + Joa (MEAN SES), + Yu ( SECTOR), | (4. 27a] 
iy, = By, - [7 + Ju (MEAN SES), + Jn (SECTOR), } (4. 27b) 
而 相应 的 经 验 贝 叶 斯 残 差 是 : 


uy = Be, ~ [Yo + Fn (MEAN SES), + Ja ( SECTOR), ] (4, 28a] 


wy = Bi ~ [ Fi + Yu (MEAN SES), + yn (SECTOR), ] (4. 28h] 


结果 如 图 4.3 所 示 。 纵 轴 代表 截 距 残 差 ， 横 轴 代 表 斜 率 残 差 。 最 小 二 乘法 
(OLS) 的 斜率 残 差 有 很 大 的 误导 性 ， 它 表明 SES 与 成 绩 关 系 上 有 相当 一 部 分 
的 方差 未 被 解释 。 与 此 相反 ， 经 验 贝 叶 斯 残 差 紧密 集中 在 零 值 附近 ， 而 且 离 散 
性 也 小 于 图 4. 2 的 相应 水 平 ， 这 个 结果 与 表 4. 5 的 结果 是 一 致 的 ， 社 会 经 济 状 
况 均值 和 学 校 类 别 解释 了 B, 变 化 中 的 78% 。 

与 之 相反 ， 对 截 距 的 经 验 贝 叶 斯 残 差 和 最 小 二 乘法 残 差 却 非常 相近 。 但 
是 ， 这 些 残 差 的 离散 性 小 于 无 条 件 模型 (图 4.2)。 这 和 方程 4.21a 解释 了 Bu 
变化 的 73% 是 一 致 的 。 

(a) WRR RA (OLS) 


60+ Lal 
- * 
m = * t+ 
OLS a * 32343** 
Ss ee 422263433233 ee 二 
0.0+ ee 2423323232262 0% 2* 


一 *2444444 4232* 4 * 
s * 2323% 422* 2 

- to 

一 t+ ik 


(b) SHG TOP MAH (EB) 


60+ 


图 4.3 对 160 所 高 中 学 校 的 常规 最 小 二 乘法 和 经 验 贝 叶 斯 方法 的 
RES HR 
注 : RRA, PEIR A RE 
a 符号 “+ ”代表 观测 数 多 于 9 个 - 
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区 间 估 计 的 比较 


除了 层 -1 系数 的 点 估计 之 外 ， 还 可 以 根据 方程 3.65 计算 经 验 贝 叶 斯 方 
法 的 区 间 估 计 。 这 里 通过 两 所 学 校 (学 校 22 和 135) 来 示范 这 个 比较 过 程 ， 
并 且 对 每 所 学 校 自己 的 数据 分 别 做 的 最 小 二 乘法 回归 中 得 到 的 置信 区 间 估 计 结 
打 进 行 比较 。 表 4.7 列 出 了 最 小 二 乘法 、 无 条 件 收缩 和 条 件 收缩 的 Bu 和 局 ,的 
95% BE fi X E] o 


表 4.7 层 -1 随 机 系数 的 95% 置信 区 间 的 估计 
最 小 二 乘法 无 条 件 收缩 条 件 收缩 
案例 Bo B, Bo, By Boj By 





22 (9.69, 12.59) ( =3,01, 1.45) (9.81, 12.63) ( -0. 15, 2.43) (9.64, 12.24) (0.24, 1.10) 


135 (1.37, 7.73) (-4. 11, 4.61) (3.65,9.21) (0.41, 3.45) (6.43, 10.77) (2.19, 3.11) 





注意 ， 对 于 案例 22 (样本 规模 n=67)， 学 校 平均 成 绩 B 的 置信 区 间 的 二 
种 分 析 结 果 都 很 相似 ， 这 主要 是 因为 它 有 较 大 的 样本 规模 ， 因 而 学 校 均值 有 很 
高 的 可 靠 性 。 相 反 . 对 于 案例 135 (样本 规模 n=14)， 随 着 估计 方法 的 变化 ， 
从 最 小 二 乘法 到 无 条 件 收缩 再 到 条 件 收缩 ， 置 信 区 间 的 宽度 逐渐 缩小 。 方 程 
4.21 的 条 件 收缩 模型 估计 下 的 95% 的 置信 区 间 比 只 用 这 所 学 校 的 数据 所 做 的 
最 小 二 乘法 估计 结果 小 了 1/3。 这 一 精度 的 提高 在 于 利用 了 整套 数据 中 的 所 有 
信息 来 进行 估计 工作 。 

当 我 们 比较 社会 经 济 状况 与 成 绩 之 间 和 斜率 的 置信 区 间 估 计时 ， 精 度 提高 得 
更 大 。 对 于 案例 22， 条 件 模型 的 经 验 贝 叶 斯 95% 园 信 区 间 的 估计 值 比 最 小 二 
乘法 的 估计 值 小 75% ; 对 于 案例 135 ， 大 约 小 了 85%. HER, KARAT, € 
条 件 收缩 的 情况 下 ， 社 会 经 济 状 况 与 成 绩 的 斜率 为 负 的 可 能 性 变 得 非常 小 ;而 
在 最 小 二 乘法 的 情况 下 ， 斜 率 为 负 的 可 能 性 却 非常 大 。 


需要 注意 的 问题 


当 正确 设置 了 层 - 2 模型 时 ， 条 件 收 缩 估 计 值 比 最 小 二 乘法 估计 值 更 准 
确 。 也 就 是 说 ， 经 验 贝 叶 斯 条 件 收缩 的 内 在 假设 是 ， 给 定 层 -2 的 自 变量 后 ， 


回归 线 是 “有 条 件 地 互 换 的 "， 这 意味 着 ， 在 方程 4. 21 中 ， 一 旦 考虑 了 MEAN 
SES 和 SECTOR， 那 么 任何 学 校 的 回归 线 与 其 预测 值 的 离 差 都 不 会 比 其 他 学 校 
大 或 小 。 这 一 假定 非常 依赖 于 层 -2 异型 的 有 效 性 。 如 果 该 模型 有 问题 ， 经 验 
贝 叶 斯 估计 也 会 有 问题 。y 参数 的 预测 值 会 有 偏差 ， 经 验 贝 叶 斯 收缩 会 扭曲 每 
个 组 的 估计 方程 。 我 们 在 第 5 章 估计 个 别 组 织 的 工作 效率 时 将 再 次 讨论 这 个 
问题 ， 


本 章 术语 概要 


B, 的 可 能 值 域 : 我 们 可 以 计算 层 -1 的 任何 随机 系数 B, 的 可 能 值 域 。B， 
的 95% 的 可 能 值 域 是 y+1.96(7,,)'*。 根 据 层 -2 随机 效应 服从 正 态 分 布 的 
假定 ， 我 们 可 以 期 望 层 -2 单位 B, 值 的 95% 落 入 这 一 区 间 。 

层 -1 所 解释 的 方差 比例 : REA ERY WAR -1 模型 时 ,， 层 -1 所 
前 减 的 方差 比例 ， 或 称 “解释 方差 比例 ”"。 这 个 指标 的 计算 是 通过 比较 拟 合 模 
型 的 残 差 的 o 估计 值 和 “基准 ” (base) 模型 或 称 参照 模型 的 o 估计 值得 到 
的 。 层 -1 的 参照 模型 一 般 选 取 单 因素 随机 效应 的 方差 分 析 模 型 (参见 方程 
4.20). 

层 -2 每 个 B, 所 解释 方差 的 比例 : 就 是 将 自 变量 外 纳入 层 -2 模型 来 解释 
某 一 Bu 时 ， 这 一 层 - 1 随机 系数 (包括 截 距 和 斜率 ) 的 方差 前 减 比 例 ， 或 称 
“解释 方差 比例 ”。 这 个 指标 是 通过 比较 由 拟 合 模型 的 残 差 的 rw 估计 值 和 某 一 
参照 模型 的 rw 估计 值 来 计算 的 。 层 -2 的 参照 模型 一 般 选 取 随 机 系数 回归 模型 
(参见 方程 4. 24)。 
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组 织 研究 中 的 应 用 


e 组 织 戏 应 研究 的 背景 

e 建立 模型 

© 例 1; 通过 随机 截 距 模型 对 组 织 共 同 效应 建 模 

例 2: 通过 以 截 距 和 斜率 为 因 变 量 的 模型 来 解释 组 织 的 不 同 效应 
日 层 -1 方差 异 质 性 情况 下 的 应 用 

o 组 织 效应 研究 中 层 -1 自 变量 的 对 中 

使 用 方差 统计 量 的 剂 减 比例 

© 估计 个 别 组 织 的 效应 

© 设计 两 层 组 织 效 应 研究 时 对 功效 的 考虑 


组 织 效 应 研究 的 背景 


过 去 ， 在 组 织 研究 中 对 多 层次 数据 的 分 析 存 在 一 些 理论 和 技术 上 的 困难 。 
最 常 遇 到 的 问题 是 汇总 偏差 、 错 估 标 准 误 以 及 回归 的 异 质 性 。 

简 划 地 说 ， 汇 总 偏差 发 生 在 一 个 变量 具有 多 种 含义 因而 在 不 同 的 组 织 层次 
上 具有 不 同 效应 的 情况 下 。 例 如 在 教育 研究 中 ， 学 校 的 平均 社会 状况 对 学 生成 
绩 的 影响 可 能 高 于 并 超越 学 生 本 人 社会 状况 的 影响 。 在 学 生 层次 上 ， 社 会 阶层 
测量 的 是 学 生 家 庭 环境 里 智力 的 和 实体 的 资源 。 在 学 校 层次 上 ， 平 均 社 会 状况 
却 是 学 校 资 源 和 规范 的 环境 指标 。 分 层 线性 模型 有 助 于 解决 这 种 混合 性 问题 ， 
将 变量 之 间 的 关系 分 解 。 比 如 ， 将 学 生成 绩 及 其 社会 阶层 之 间 的 关系 分 解 为 
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I -1 AA -2 WR 

在 多 层 数据 的 情况 下 ， 错 估 标 准 误 的 发 生 是 由 于 未 考虑 在 同一 组 织 内 个 人 
回答 之 间 存 在 关联 性 。 这 种 关联 性 可 能 是 由 于 组 织 内 的 共同 经 历 ， 或 由 于 当初 
人 们 进入 这 一 组 织 时 的 选择 方式 。 分 层 线性 模型 解决 这 一 问题 的 方法 是 ， 在 统 
计 模 型 中 对 每 个 组 织 单位 加 入 一 个 特殊 随机 效应 ， 在 进行 标准 误 的 估计 时 将 这 
些 随 机 效应 的 变异 加 以 考虑 ， 按 照 调 查 研究 的 术语 ， 这 些 标准 误 的 估计 值 是 根 
据 因 整 拜 抽样 而 导致 的 组 内 相关 性 (或 与 之 相关 的 设计 效应 ) 加 以 调整 的 
结果 ， 

回 妇 的 异 质 性 发 生 在 个 人 特征 和 因 变 量 之 间 的 关系 在 不 同 组 织 间 有 所 变化 
的 情况 下 。 尽管 这 种 现象 经 常 被 认为 是 方法 论 开 的 麻烦 事 ， 但 是 人 们 经 常 对 回 
归 异 质 性 原因 的 探讨 抱 有 很 大 的 兴趣 。 分 层 线性 模型 可 以 对 每 个 组 织 单位 分 别 
估计 出 一 套 回 归 系 数 ， 然 后 将 这 些 组 织 的 回归 系数 作为 结果 ( 因 变 量 ) 建 立 模 
型 ， 并 用 组 织 的 因素 解释 其 变化 。Burstein (1980) 的 文章 很 好 地 总 结 了 这 一 
以 斜率 作为 结果 的 分 析 思 路 。 


建立 模 型 


许多 关于 组 织 如 何 影响 其 中 个 人 的 问题 可 以 通过 两 层次 的 分 层 线性 模型 
来 处 理 。 层 -1 的 单位 是 个 人 ,个 人 的 结果 表现 为 一 系列 个 人 特征 的 函数 。 
层 -2 的 单位 是 组 织 。 层 - 1 模型 将 每 个 组 织 的 层 - ! 模型 的 回归 系数 作为 
因 变星 ， 并 假设 它 依赖 于 具体 的 组 织 特征 。 


个 人 层次 模型 ( 层 一 1) 


我 们 用 3 表示 第 j 个 组 织 中 第 i 个 人 的 结果 。 这 个 因 变量 是 一 系列 个 人 特 
征 忒 ,和 误差 项 WRM: 
Y, = By +B,X,, +R + + ByXq, +1, [5.1] 
其 中 ,我 们 假设 ~ NCO, °) (本 章 的 后 面 将 介绍 扩展 的 异 质 性 层 - 1 方差 
模型 ) 。 
回归 系数 Bu，9 =0，…，Q， 表 示 在 组 织 j 中 作为 个 人 特征 函数 的 因 变量 是 
如 何 分 布 的 。 因 此 ， 我 们 将 这 些 回归 系数 称 作 分 布 效应 (distributive effects) 。 
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组 织 层 次 模型 ( 层 一 2) 


由 方程 5.1 中 的 一 组 B, 所 反映 的 每 个 组 织 效应 在 不 同 单位 之 间 是 不 同 的 ， 
这 种 变化 在 O +1 个 层 -2 的 方程 中 加 以 拟 合 ， 对 应 每 个 层 - 1 模型 回归 系数 
有 一 个 方程 。 每 个 B, 被 作为 依赖 于 一 系列 组 织 层次 变量 W 和 一 个 特殊 组 织 效 
应 us 的 因 变 量 。 每 个 B。 具 有 如 下 的 模型 ， 


By = Ya +YaWy + yaWy + + Yes, Ws,s tuy {5.2] 


组 织 特征 对 


组 织 j 
HEREN 。 MNH 


— “。 织 内 的 分 布 。 ”特殊 效应 
的 影响 
其 中 对 每 个 B, 有 一 系列 具体 的 W, s=1, =, Syo 


Yu 系数 反映 组 织 变量 W, 对 由 Bu 所 代表 的 组 内 关系 的 影响 。 我 们 一 般 候 
E, 0+1 个 层 -2 随机 效应 为 多 元 正 态 分 布 ， 每 个 ww 有 平均 数 为 0、 方 差 为 
Tw， 以 及 任意 两 个 随机 效应 g 和 gq' 之 间 的 协 方差 为 7,,。 这 些 都 是 在 第 3 章 中 
介绍 过 的 标准 层 - 2 模型 的 假定 条 件 ， 并且 还 将 在 第 9 章 中 加 以 更 详细 的 
讨论 。 

在 本 章 接 下 来 的 两 节 里 ， 我 们 要 讲解 如 何 将 这 一 模型 应 用 到 对 两 大 类 组 织 
效应 的 研究 中 。 在 “ 例 1” 中 ， 组 织 的 某 些 方面 ， 例 如 技术 、 结 构 或 氛围 ， 对 
组 织 内 的 每 个 人 都 有 相同 的 影响 。 这 种 组 织 效 应 只 影响 本 组 织 的 结果 的 平均 水 
平 ， 而 不 影响 本 组 织 内 个 人 效应 的 分 布 。 用 统计 术语 讲 ， 只 有 和 截 距 Bu 在 组 织 
之 间 变 化 ， 而 其 他 所 有 层 -1 系数 都 不 变 。 正 如 在 本 节 里 所 讨论 的 ， 这 些 问题 
要 使 用 随机 截 距 模型 。 

在 “ 例 2” 中 ， 组 织 效应 既 影 响 结果 的 平均 水 平 ， 又 影响 个 人 之 间 的 效应 
分 布 。 用 统计 术语 讲 ， 截 距 和 回归 斜率 在 各 单位 之 间 都 发 生变 化 。 在 这 一 节 中 
将 详细 讨论 以 截 距 和 和 斜率 作为 因 变 量 的 完全 分 层 线性 模型 。 

这 一 章 的 其 余部 分 是 一 系列 的 “专题 "， 涉 及 组 织 研究 中 分 层 模 型 的 各 种 
设计 和 使 用 ， 有 许多 内 容 是 在 第 2 版 中 新 增加 的 。 我 们 将 说 明 如 何 将 基本 的 分 
慨 模型 推广 应 用 到 层 - 1 存在 方差 异 质 性 的 情况 。 接 着 ， 我 们 将 说 明 层 -1 变 
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其 的 对 中 选择 将 如 何 影响 层 - 1 随机 系数 Bj、 固 定 效应 y 和 方差 协 方差 成 分 
rw、7w 和 "的 估计 - 然后， 我们 讨论 在 较为 复杂 的 组 织 效应 模型 中 对 解释 方 
差 比例 的 统计 般 释 中 可 能 产生 的 问题 。 我 们 将 描述 如 何 应 用 层 - 1 系数 的 经 验 
贝 叶 斯 估计 作为 具体 组 织 单位 的 绩效 指标 (performance indicators) ， 并 讨论 在 
这 些 应 用 中 可 能 产生 的 有 效 性 (validity) 问题 。 本 章 最 后 将 介绍 ， 在 两 层 的 


组 织 效应 研究 中 设计 新 数据 收集 时 对 功效 (power) 问题 的 考虑 。 


例 1: 通过 随机 截 距 模型 对 组 织 共同 效应 建 模 


这 一 例子 的 基本 问题 是 ， 主 要 预测 变量 (MARR) 是 在 组 织 层次 上 测 
RS, MARR (MAER) 是 在 个 人 层次 上 测量 的 。 以 往 这 类 数据 产生 
的 问题 是 ， 应 当 采 用 什么 分 析 单 位 更 合适 (组织 还 是 个 人 ) ， 以 及 相应 产生 的 
问题 。 如 果 在 个 人 层次 上 进行 数据 分 析 ， 便 忽略 了 个 人 嵌 套 于 组 织 单位 的 情 
况 ， 那 么 估计 的 标准 误 就 太 小 ， 犯 第 一 类 错误 的 风险 就 加 大 了 。 如 果 在 组 织 层 
次 上 分 析 ， 就 要 以 每 个 人 的 结果 的 平均 数 作为 因 变量 ， 那 么 要 加 入 其 他 层 -1 
上 的 自 变量 就 成 问题 了 。 此 外 ， 组 织 效 应 的 估计 还 会 产生 精度 下 降 问 题 和 偏差 
问题 。 这 里 ， 关 键 问题 是 随机 变化 和 结构 效应 在 各 个 层次 上 都 可 能 存在 ， 那 么 
要 想 明 确 地 表现 出 这 些 特征 ， 就 应 该 采用 分 层 模型 。 


一 个 简单 的 随机 截 距 模 型 


随机 截 距 模型 的 基本 思想 在 第 2 章 已 经 进行 了 介绍 。 这 类 模型 的 主要 特点 
是 方程 5.1 中 层 - 1 模型 中 的 截 距 Bu 在 层 -2 上 是 变化 的 。 具 体 地 说 ， 层 -2 
上 的 组 织 模型 包括 : 


Bo, = Yoo + Yor Wu + Yo Wy + + Yos Ws + Ug, 


By, = %0 


By =Y% 
[5.3] 


Bos = Yo 


5 ”组 织 研究 中 的 应 用 99 


例子 : 考察 学 校对 教师 效率 的 影响 


Bryk 和 Driscoll (1988) 使 用 高 中 及 以 上 学 校 管 理 人 员 和 教师 补充 调查 数 
据 ， 考 察 了 学 校 组 织 的 特征 与 教师 工作 效率 意识 的 关系 。 具 体 地 说 ， 他 们 假设 
共管 制 组 织 形 式 的 学 校 的 教师 要 比 在 科 层 制 组 织 形式 的 学 校 的 教师 有 更 高 的 效 
率 。 数 据 包括 357 所 学 校 的 8000 名 教师 ， 学 校 的 平均 样本 规模 为 22 A, 

教师 层次 上 的 模型 定义 在 同一 学 校内 的 教师 之 间 有 不 同 的 效率 意识 。 由 于 
没有 教师 变量 作为 层 -1 的 自 变量 ， 方 程 5. 1 就 简化 为 : 


Y, = By +Y; [5.4] 


HP, VARJI TERRE i 个 教师 所 报告 的 效率 ，Bo 是 第 j 个 学 校 真 实 的 平 
均 效 率 。 
我 们 估计 了 学 校 层次 的 三 个 模型 。 第 一 个 是 无 条 件 的 Bu 模型 。 它 是 单 因 
素 随 机 效应 方差 分 析 模型 ， 将 了; 的 总 方差 分 解 为 学 校 之 内 和 学 校 之 间 两 个 部 
分 。 后面 将 会 看 到 ，o” 和 rm 各 自 的 估计 值 对 评估 随后 的 模型 结果 是 有 帮助 
的 。 第 二 个 模型 考察 一 些 学 校 构成 和 规模 的 变量 对 教师 效率 的 影响 ( 见 表 5. 1 
对 变量 的 描述 ) ， 模 型 如 下 ， 
Bo, = yo + Ya (MEAN BACKGROUND), + yo ( MEAN SES), + ye (HI MINORITY), 
+ Ya (SIZE), + yos (ETHNIC MIX), + yo (SES MIX), + uy [5.5] 


第 三 个 模型 在 方程 5. 5 中 加 入 了 学 校 共管 制 组 织 程度 的 变量 COMMUNAL, FE 
这 两 个 模型 中 ， 学 校 独特 的 残 差 效应 uo 被 假设 为 服从 平均 数 为 0 和 方差 为 rw 
的 正 态 分 布 。 


RSL 学 校 组 织 对 教师 效率 影响 研究 中 的 变量 描述 


变量 名 称 i 述 


教师 效率 (TEACHERS EFFICA- | 由 教师 5 个 方面 的 工作 满意 度 乌 成 。 这 县 一 个 标准 化 变量 (PF 
cy) 均 数 =0; RER = 1.0). 

78m CMEAN BAGK | 由 学生 人 学 前 学 业经 历 成 绩 (比如 级 别 ) 和 人 学 的 初始 成 绩 〈 如 

— | 。 英语 或 数学 ) 的 4 个 方面 组 成 。 这 是 一 个 标准 化 变量 (平均 数 

i =0; 标准 差 =1.0) ， 正 值 表明 背景 较 强 。 








100 ”分 层 线 性 模型 : 应 用 与 数据 分 析 方法 








续 表 5.1 
EMS i | fh ik 
——— — | rer Ty a 这 是 一 个 标准 化 变量 . EAR 
明 所 在 学 校 较 富 有 ， 
种 族 (HI MINORITY ) | 这 是 个 虚 氢 变量 ， 表 示 学 校 中 少数 种 族 学 生 超过 40% 。 
规模 (SIZE) 学 校 学 牛人 数 的 自然 对 数 。 


这 是 一 个 学 校内 学 生 种 族 差异 方面 的 标准 化 变量 。 较 小 值 表明 种 


种 族 构成 (ETHNIC MIX) 
族 单 一 、 较 大 的 正 值 表明 种 族 多 样 。 


这 大 一 个 学 校内 学 生 社 会 经 济 状况 构成 的 标准 化 变 最 。 正 值 表明 


社会 经 济 状 观 构成 (SES MIX) 
学 校 的 社会 异 质 性 强 


这 是 一 个 合成 指标 ， 是 根据 学 校 的 共管 制 组 织 程 度 的 23 个 方面 计 
算 的 ， 它 是 一 个 标准 化 变量 ， 正 值 表明 教师 在 集体 活动 、 共 同 
观念 共同 参 与 、 教 师 的 作用 等 方面 更 频繁 、 更 广泛 。 较 小 值 


表明 是 较为 隔离 、 专 业 化 和 科 层 化 的 组织 。 
CC, — — 
注 : 见 Bryk 和 Driscoll (1988) 对 这 些 变量 更 为 详细 的 讨论 ~ 


共管 制 (COMMUNAL) 





单 因素 随机 效应 方差 分 析 模 型 。 首 先 在 层 -2 拟 合 一 个 无 条 件 的 Bu 模型 。 
校内 或 层 -1 的 方差 【 即 Var(m) =o] 的 估计 值 为 0.915。 这 一 估计 值 在 这 
里 所 讨论 的 三 类 分 析 中 都 是 相同 的 ， 因 为 层 - ! 模型 (方程 5.4) 对 于 三 类 分 
析 都 是 相同 的 。 教 师 效率 的 学 校 平 均 数 的 总 变化 [ 即 Var (By = To)] 为 
0.084。 相 应 地 ， 组 内 相关 为 0.084 (见方 程 4.6) 和 教师 效率 的 学 校 平 均 数 的 
TREH 0.669 (见方 程 4.7 和 4.8)。 

两 个 层 -2 的 解释 性 模型 。 表 5.2 中 的 第 一 列 是 这 两 个 分 层 线性 模型 的 
分 析 结 果 。 上 端 是 构成 模型 的 估计 值 ， 下 端 是 加 入 变量 COMMUNAL 后 的 结 
果 。 在 构成 模型 中 (上 端 ) ， 学 生 的 “平均 学 业 背 景 ” (foa = 0.044，ase = 
0.020) 和 学 校 的 “社会 经 济 状况 均值 ”(7yo =0. 133，se =0.023) 与 教师 效 
率 感 正 相 关 。 学 校 的 “规模 ”有 显著 的 负 作 用 (7. = -0.066，se =0.027), 
无 论 是 绝对 值 还 是 与 它们 估计 的 标准 误 相 比 ， 其 他 三 个 层 -2 的 自 变量 的 影响 
都 很 小 。 

共管 制 组 织 模型 的 结果 令 人 惊讶 。 估 计 的 COMMUNAL 的 影响 (Fn = 
0.504, se=0.045) 是 最 大 的 ， 几 乎 要 比 所 有 的 其 他 变量 大 一 个 数量 级 。( 注 ; 
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表 5.2 学 校 组 织 对 教师 效率 的 影响 





多 层次 分 析 教师 层次 分 析 学 校 层 次 分 析 
系数 标准 误 系数 标准 误 系数 标准 误 
结构 构成 模型 
平均 学 业 背 景 ，Yo， 0. 044 0, 020 0.046 0.014 0. 040 0.021 
FERRARA, Yos 0, 133 0. 023 0. 132 0.015 0. 137 0. 023 
HIK, Yo 0,031 0. 046 0. 028 0.031 0.035 0. 047 
MA. Yos 0. 066 0.027 - 0. 066 0.019 -0, 068 0. 026 
PER, Yos -0,014 0.019 -0.014 0.013 -0.013 0.019 
社会 经 济 状况 构成 ，yo ~0, 028 0.023 -0.029 0.016 -0.025 0. 023 
JEMALA 0. 345 0. 029 0. 234 
共管 制 模型 
HSS WHER, yo 0. 038 0.017 0. 040 0.013 0. 933 0.018 
社会 经 济 状况 均值 Yo 0.015 0.022 0.015 0.017 0.019 0. 023 
HR. Ya -0.055 0.040 -0.056 0.031 -0.051 0, 041 
HA, yos 0. 061 0.026 0. 062 0.021 0. 060 0. 025 
种 族 构 成 ，yos -0.014 0.016 -0.014 0.013 -0.014 0.017 
社会 经 济 状况 构成 ，ymw 0.001 0.020 0.002 0.016 -0.000 0.020 
共管 制 ，yo 0, 504 0.045 0. 507 0. 035 0. 493 0. 045 
方差 解 妓 比例 0.631 0. 054 0.426 
方差 增 重 0, 286 0.025 0. 192 


法 多 层次 分 析 的 残 差 方差 估计 值 :， rm 【构成 模型 ) = 0.055; rm (共管 制 模型 ) =0.031。 


这 一 解释 是 基于 除了 “种 族 构 成 ”这 一 虚拟 变量 外 ， 其 他 所 有 层 -2 的 自 变量 
都 是 平均 数 =0、 标 准 差 =1.0 的 标准 化 变量 。) 这 就 是 说 ， 即 使 对 学 校 间 的 构 
成 差异 加 以 控制 后 ， 在 共管 制 组 织 的 学 校 中 ， 教 师 效率 要 明显 高 得 多 。 我 们 还 
注意 到 ,“ 社 会 经 济 状况 均值 ”在 构成 模型 中 有 较 大 影响 ， 而 在 这 里 却 几 乎 消 
KT (0.015 对 0,133)。 这 表明 在 社会 经 济 状况 均值 较 高 的 学 校 中 有 较 高 的 教 
师 效率 可 能 反映 了 这 些 学 校 中 较 高 的 共管 制 组 织 程度 。 还 要 注意 ， 学 校规 模 的 
影响 变 为 正 的 ， 表 明 在 控制 共管 制 组 织 程度 后 ， 规 模 较 大 的 学 校 教师 效率 较 
高 。 如 Bryk 和 Driscoll (1988) 所 解释 的 ， 在 规模 较 大 的 学 校 ， 教 师 效 率 会 较 
低 ， 因 为 这 些 学 校 不 太 可 能 采用 共管 制 。 但 对 这 一 因素 加 以 控制 后 ， 规 模 较 大 
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的 学 校 似 乎 提高 了 教师 效率 ， 可 能 是 由 于 在 规模 较 大 的 学 校 存在 更 多 的 资源 和 
就 业 机 会 。 

对 构成 效应 加 以 控制 后 ， 如 方程 5.5 所 示 ， 层 -2 的 残 差 变异 为 0.055， 
我 们 将 其 表示 为 zw。 这 个 模型 解释 了 学 校 之 间 教 师 效 率 平均 数 的 总 方差 的 
34. 5%。 这 一 方差 的 削减 比例 是 用 第 4 章 中 介绍 的 方程 计算 的 。 具 体 地 说 ， 





: jag ËR) - Fn URIEN) 
方差 解释 比例 = 一 -一 Fo EAI) 





n 0.088 5 O88) = 0.345 [5.6] 
EP, Toy (ER EFRA PHR GEE, h oL A 
析 模 型 估计 。 
当 变 量 COMMUNAL 被 加 入 模型 中 后 ， 得 到 解释 的 方差 比例 上 升 到 63. 1% ， 
BD Bu 的 残 差 方 差 rm (共管 制 模型 ) 为 0.031。 用 7 加 (共管 制 模型 ) 代替 方程 
5.6 中 的 rw 《构成 模型 ) ， 就 得 到 解释 的 方差 比例 为 : 


(0. 084 ~ 0.031) 


ooa = 0.631 [5.7] 


模型 加 入 COMMUNAL 后 所 增加 的 方差 解释 比例 为 28. 6% 。 这 个 值 是 方程 5.6 
和 5.7 的 结果 的 差 。 


与 传统 的 教师 层次 和 学 校 层次 分 析 结 果 的 比较 


表 5.2 中 还 展示 了 教师 层次 〈 层 - 1) 研究 和 学 校 层次 ( 层 -2) 研究 的 
分 析 结 果 。 将 这 些 结果 与 分 层 模型 的 结果 进行 对 比 有 助 于 说 明 随 机 截 距 模型 估 
计 的 基本 特征 。 下 面 我 们 比较 从 这 些 模 型 计算 得 到 的 固定 效应 的 估计 值 、 这 些 
估计 值 的 标准 误 以 及 解释 的 方差 。 

固定 效应 。 请 注意 表 5.2 中 回归 系数 的 估计 值 在 三 类 分 析 中 很 相似 。 分 层 
模型 的 估计 值 与 教师 层次 模型 的 估计 值 更 为 接近 ， 在 一 般 情 况 下 都 是 如 此 。 

如 在 第 3 章 中 介绍 的 ， 在 分 层 线性 模型 中 层 -2 系数 估计 可 以 看 作 是 加 权 
最 小 二 乘 估计 ， 其 中 的 权 数 为 


Aj! = (VW tra) [5.8] 
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假定 层 -1 的 方差 同 质 ( 即 对 于 所 有 /有 o =a?)， 那 么 V=o /Vn,， 权 数 的 变 
化 严格 依 琥 于 n,， 

相 比 之 下 ， 虽 然 OLS 单 层次 分 析 也 是 加 权 的 ， 但 是 权 数 就 只 是 n RE 
地 说 ， 假 设 在 一 个 单 变量 的 模型 中 ， 教 师 的 结果 ,取决 于 学 校 特征 W: 


Y= yo + YW +e, [5.9] 
OLS 单 层次 分 析 的 y, 估计 公式 如 下 : 


YH, - WY, -¥) 


3 ra =e [5.10] 
请 注意 ， 分 子 和 分 母 是 均 方 和 与 交叉 乘积 和 ， 并 由 诈 而 不 是 A IMAL. 
相反 ， 层 -2 的 分 析 是 未 加 权 的 ， 其 单 变量 模型 为 : 
= 7 [5.11] 
相应 的 y, 估计 公式 为 : 
-W - Y.. 
- — Weti [5.12] 


12 ELA 
其 中 : 
Ye DY 和 Ws Dw. 


所 有 这 三 个 估计 值 都 是 无 偏 估计 ,但 是 分 层 估计 是 最 有 效率 的 。 这 三 类 分 
析 结 果 的 差异 取决 于 n 的 差异 程度 (如 果 在 /个 组 织 中 ， 样 本 规模 n, 是 相同 
的 ， 那么 三 个 估计 值 也 相同 )。 在 Bryk 和 Driscoll (1988) 的 研究 中 ，m 没有 
很 大 差别 ， 绝 大 多 数学 校 的 案例 数 在 20 ~ 30 之 间 。 于 是 ， 层 -2 的 研究 结果 
就 比较 接近 。 

总 之 ,在 层 -2 分 析 中 数据 不 平衡 的 条 件 下 ， 对 固定 效应 进行 估计 的 稳健 
性 (robustness) 就 是 需要 加 以 关注 的 问题 。 一 个 样本 规模 非常 小 的 单位 很 容 
易 成 为 异常 值 (outlier) 或 杆 杆 点 (leverage point) ， 因 为 这 一 单位 因 信息 有 限 
而 不 稳定 。 在 分 层 研 究 和 层 - 1 研究 中 使 用 的 加 权 方 法 能 对 这 一 方面 加 以 
保护 。 

固定 效应 的 标准 误 。 在 本 章 的 引言 中 已 经 介绍 过 ， 层 - 分 析 产 生 的 标准 
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误 往往 过 小 ， 因 为 它 没有 考虑 这 样 一 个 事实 : 层 ~ 1 的 单位 并 不 是 独立 的 ， 而 
是 整 群 地 说 套 于 层 -2 单位 的 。 例 如 在 上 面 的 构成 分 析 中 ， 层 -1 的 估计 值 基 
本 上 要 比分 层 分 析 和 层 -2 分 析 的 相应 值 小 三 分 之 一 。 

在 样本 规模 不 等 的 条 件 下 ， 直 接 对 这 三 种 不 同 标准 误 的 计算 公式 进行 比较 
是 很 困难 的 。 不 过 ， 如 果 在 数据 平衡 且 只 有 一 个 自 变量 W 的 情况 下 ， 我 们 可 
以 确认 一 些 基 本 的 特征 。y, 的 抽样 方差 的 期 望 估计 在 分 层 线性 模型 和 层 -2 分 
析 中 是 相等 的 : 


er V + tw P 
El Var(y,)) z ~n [5.13] 
' whe 项 w, -W * 


对 于 层 -1 的 分 析 ， 抽 样 方差 的 期 望 估计 是 : 


_ Jin -1o* + (J = 2)n(V + Ty) 


EÍ Var(y,)]y-, = 一 [5.14] 
a (Jn =2)0 X (W, - F.) 





如 果 层 -1 和 层 -2 ARE (分 别 为 n AL) 都 很 大 ,方程 5. 14 的 层 -上 分 
析 的 抽样 方差 期 望 值 与 方程 5. 13 分 层 分 析 的 抽样 方差 期 望 值 之 比 大 约 为 : 


ee she l-A 5.15 
E[ Var( V) Jam [ ] 


E[ Var(y, )), 


HP, A= Tw/[g /n+Tw]， 它 是 反映 OLS 估计 的 学 校 平 均 数 BO BT HE 
(reliability) 指标 。 

方程 5. 15 非常 近似 于 表 5. 2 中 的 经 验 值 。 在 层 - 1 平均 样本 规模 为 每 个 学 
校 22 个 教师 的 条 件 下 ， 层 - 1 的 方差 估计 值 5* =0.915， 而 构成 模型 rw 的 估 
计 值 为 0.055， 于 是 ， 


0. 055 


~ 10.915722) + (0.055) = 0 431 


1-A=1 

至 于 两 个 标准 误 的 相对 规模 便 是 它们 之 间 的 比 ， 即 (1 - A)”， 在 构成 模型 

中 ， 其 值 为 0.657。 这 个 比值 接近 于 表 5.2 上 端 部 分 中 的 结果 。 简 单 地 看 一 下 

就 可 以 发 现 ， 层 -1 的 标准 误 约 相当 于 由 分 层 分 析 和 层 -2 分 析 得 出 的 更 适当 
的 结果 的 三 分 之 二 。 

总 之 ,分 屋 分 析 可 以 准确 地 抓 住 层 -1 和 层 -2 分 析 中 那些 最 好 的 特征 。 

它 提供 了 固定 效应 的 无 偏 和 有 效 的 估计 ， 而 层 - 1 分 析 比 较 接近 这 些 估计 值 ; 
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它 同 时 还 提供 了 更 适当 的 标准 误 估 计 值 ， 不 论 单位 内 聚 类 的 程度 ， 层 -2 分 析 
比较 接近 这 些 估计 值 

上 述 结 果 在 这 类 分 析 中 是 比较 典型 的 ,固定 效应 的 估计 在 三 类 分 析 中 很 接 
近 ， 但 估计 的 标准 误 却 不 是 

解释 方差 的 统计 量 . 从 分 层 分 析 估 计 的 解释 方差 比例 和 从 传统 层 -1 分 析 
或 层 -2 分 析 的 相应 估计 值 可 能 很 不 同 ， 甚 硅 可 以 导致 不 同 的 结论 。 例 如 在 
Bryk 和 Driscoll (1988) 的 研究 中 ， 对 共管 制 组 织 的 重要 性 的 解释 很 大 程度 上 
取决 于 所 采 攻 的 分 析 方法 〈 参 见 表 5. 2 中 的 下 面部 分 ) 。 在 分 层 线性 模型 分 析 
中 ， 与 COMMUNAL 相 联系 的 解释 方差 比例 增 量 为 28. 6% ， 相 应 的 统计 贡 在 教 
师 层 次 分 析 和 学 校 层次 分 析 中 分 别 为 2.5% 和 19.2% 。 尽 管 28. 6% 大 得 足以 使 
我 们 对 所 做 的 研究 加 以 进一步 考虑 ， 但 2. 5% 的 统计 结果 却 很 容易 使 人 得 出 相 
反 的 推论 。 

要 理解 为 什么 被 COMMUNAL 解释 的 方差 比例 如 此 不 同 ,需要 弄 清 在 这 三 
类 分 析 中 总 的 因 变量 变化 是 如 何 被 分 解 的 。 在 随机 截 距 模 型 中 ， 层 -2 的 变量 
如 COMMUNAL 只 能 解释 实际 学 校 平均 数 Bu 的 差异 ， 即 只 有 参数 的 差异 rw 是 
可 以 解释 的 〈 这 就 是 为 什么 在 削减 方差 比例 的 计算 中 ， 我 们 用 无 条 件 模型 中 
的 rm 作为 分 母 ) 。 被 COMMUNAL 解释 的 28. 6% 的 方差 意味 着 学 校 平均 数 的 差 
异 中 有 很 大 一 部 分 是 与 学 校 组 织 的 差异 有 关 。 与 其 他 所 有 的 学 校 层次 上 的 差异 
相 比 ， 共 管 御 组 织 的 确 很 重要 。 

相 比 之 下 ， 在 层 -1 的 分 析 中 ， 因 变量 7 的 总 变化 To t 被 作为 解释 方 
差 统计 量 的 分 母 。 不 过 ， 组 内 变化 o 反映 的 是 个 人 效应 和 因 变 量 的 测量 误差 ， 
这 两 者 都 是 无 法 用 组 织 特征 进行 解释 的 。 依 照 这 一 标准 来 判断 ， 有 些 人 研究 人 员 
可 能 会 错误 地 认为 COMMUNAL 的 影响 小 得 不 值 一 提 。 

一 般 说 来 ， 分 层 分 析 与 层 - 1 分 析 相 比 ， 相 对 的 解释 方差 取决 于 下 面 这 个 
比值 : 


MAH Tw 
MAGEE) “tore 7? [5.16] 





其 中 , p 是 组 内 相关 系数 (见方 程 2. 10) 。 请 注意 ， 组 内 相关 表示 的 是 理论 上 
EER 了 ,的 总 方差 中 所 有 学 校 因素 能 够 解释 的 最 大 数量 。 如 上 所 述 ， 教 师 效 
率 数 据 中 ， 估 计 的 组 内 相关 为 0.084。 我 们 用 将 层 -1 分析 和 分 层 分 析 中 的 
解释 方差 的 统计 量 联系 起 来 ， 有 : 
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P x [解释 方差 增 量 ( 分 层 ) | = 【解释 方差 增 量 ( 层 - 1) ) 
0.084 x [0.286] = 0. 024 


我 们 也 可 以 得 到 一 个 类 似 的 公式 来 比较 分 层 分 析 和 层 -2 分 析 的 解释 方差 的 
统计 量 。 层 -2 分 析 中 解释 方差 统计 和 量 的 分 姓 是 re +o /mw， 这 正好 就 是 样 
本 平均 数 的 总 方差 。 这 样 ， 分 层 分 析 与 层 -2 分 析 相 比 ， 相 对 的 解释 方 
EH: 

WR Ir % (Te - 2) Too 


一 一 一 一 = 入 [5.17] 
解释 方差 (分 层 } ”rm + (an) 





其 中 ，A 是 在 层 -1 平均 样本 规模 为 5 的 条 件 下 ，Y., 作 为 ,的 估计 值 (见方 
程 4.8) 的 平均 可 靠 性 。 对 于 教师 效率 数据 ，A 为 0.669， 由 层 -2 分 析 所 解释 
的 方差 大 约 是 相应 分 层 分 析 中 的 三 分 之 二 。 

总 之 ， 分 层 分 析 中 的 解释 方差 的 统计 提供 了 最 清晰 的 证 据 来 判断 层 - 2 的 
自 变量 的 重要 性 。 它 们 既 不 会 像 层 -1 的 统计 量 那 样 受 集群 程度 的 影响 ( 即 依 
赖 于 p) ， 又 不 会 像 层 -2 的 统计 量 那样 受 了 ., 的 不 可 靠 性 的 影响 。 另 外 ， 由 于 
A 和 p 的 估计 值 在 传统 分 析 中 一 般 得 不 到 ,分 析 人 员 根 本 无 法 估计 一 套 层 -2 
自 变量 在 任何 模型 上 的 解释 力 与 最 大 解释 程度 的 相对 规模 。 从 直观 上 讲 ， 这 正 
是 解释 方差 统计 应 该 告诉 我 们 的 。 


包括 层 -1 协 变量 的 随机 截 距 模型 


在 上 一 个 例子 中 ,我们 估计 了 组 织 特征 和 因 变 量 平均 数 之 间 的 关系 。 我 们 
没有 根据 不 同 组 织 内 个 人 的 不 同 特征 去 调整 层 -2 效应 的 估计 值 。 

一 般 说 来 ， 根 据 个 人 背景 进行 统计 调整 很 重要 ， 其 理由 有 二 : 第 一 ， 由 于 
个 人 常常 并 不 是 被 随机 分 配 到 组 织 之 中 的 ， 因 此 如 果 对 个 人 背景 不 加 以 控制 就 
会 使 组 织 效应 的 估计 产生 偏差 ; 第 二 ， 如 果 层 -1 的 自 变量 (或 称 协 变量 ) 与 
因 变量 高 度 相关 ， 那 么 对 它们 加 以 控制 ， 将 会 因为 威 少 层 - 1 未 解释 的 残 差 方 
差 o 而 增加 组 织 效 应 估计 的 精度 和 假设 检验 的 功效 。 

这 类 分 析 的 正规 模型 在 第 2 章 进行 了 介绍 。 在 层 -1， 有 : 


Yy = By + B,(X,, - Xe + Byl Xy = F Dt + Balle, - Xo.) +r; [5.18] 
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ie -2 模型 就 是 方程 5.3 由 于 每 个 协 变 量 以 各 自 的 总 平均 数 对 中 ， 则 随机 
Hi B 就 是 一 个 调整 平均 数 ， 而 不 是 原始 的 平均 数 。 在 协 方差 分 析 (ANCO- 
VA) BOOT, WHS. 18 假定 层 -1 的 系数 B,,，…，Bw 具 有 同 质 性 。 这 一 假定 
是 省 有 效 可 以 通过 第 3 章 中 介绍 的 方法 很 容易 地 进行 检验 。 如 果 需 要 的 话 ， 任 
何 屋 -1 系数 都 可 以 设置 为 非 随机 变化 的 ， 或 设置 为 随机 效应 。 


例子 : 写作 的 项 目 效 果 评 估 


这 一 实例 使 用 写作 的 认 知 策略 项 目 (Cognitive Strategies in Writing Project) 
的 数据 (Englert et al. ，1988)， 该 项 目的 目的 是 通过 一 系列 策略 来 改进 儿童 的 
写作 能 力 和 提高 儿童 对 学 业 能 力 的 自我 认识 。 因 变量 是 学 术 能 力 的 自我 评价 
(均值 =2.918; 标准 差 =0.580) ， 一 项 前 测 值 ,作为 协 变量 。 样 本 包括 22 个 
班级 的 256 名 儿童 ， 用 标准 的 -组 设计 方法 ， 以 15 个 班 为 实验 组 ，7 个 作为 
控制 组 。 由 于 班级 的 老师 在 实施 实验 时 包括 了 整个 班级 的 学 生 ， 因 此 用 经 典 的 
术语 讲 ， 这 是 一 个 覆 套 或 分 层 的 设计 : AREF BEDE, THEBES EF 2 
计 分 组 。 与 前 面 的 例子 一 样 ， 我 们 首先 来 看 分 层 分 析 的 结果 ， 然 后 将 这 些 结果 
对 比 两 种 传统 分 析 的 结果 : 在 学 生 层次 上 忽略 班级 的 协 方差 分 析 模型 和 基于 班 
级 平均 数 的 协 方差 分 析 模 型 。 

对 于 分 层 分 析 . 层 ~1 的 模型 如 下 : 


¥, = By +B,(X, -X + [5.19] 


其 中 : 

) 是 第 j 个 班级 (j=1,…，22) 中 第 i 个 学 生 的 自我 能 力 评估 ; 

Bw 是 在 控制 前 测 状况 的 差异 后 第 j 个 班级 调整 的 平均 结果 ; 

,是 固定 的 层 -1 协 变量 效应 。 

初步 分 析 模型 中 设 定 Bu 和 B, 都 是 随机 的 ， 并 检验 协 变量 效应 的 同 质 性 假 
设 [Ho: Var(B,,) =0]。 鉴 于 这 一 B, 的 零 假 设 得 以 保留 ， 可 以 将 前 测 协 变量 设 
定 为 固定 效应 。 最 后 的 层 -2 模型 为 ; 


Bo, = Yoo + Yo W, + Hoy [5.20] 
By = Ym 


其 中 ， 
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W, 是 实验 处 理 标识 变量 (1 = 实验 组 ; 0 = 控制 组 ); 

ym 是 控制 班 的 调整 的 平均 评价 值 ; 

Yu 是 实验 处 理 效应 ; 

yw 是 层 -1 协 变量 汇合 的 班级 内 回归 系数 。 

表 5.3 展示 了 这 一 分 析 结果 。 对 前 测 值 进 行 调整 后 的 实验 组 和 控制 组 平均 
结果 的 差异 为 0. 188[: =1.87，df= 20，p( 单 尾 ) <0.04] 。 汇 合 的 班级 内 回归 
斜率 为 0.396 (1=7.02, p <0.001)。 


与 传统 的 学 生 层 次 和 班级 层次 分 析 结 果 的 比较 


学 生 层 次 分 析 的 模型 为 


Y, = Yo + YW, + yo KX) +r, [5.21] 


其 中 ， 参 数 yoo. Yor 和 yo 分 别 代 表 截 距 、 实 验 效 应 和 协 变量 效应 ,不 . 是 前 测 
平均 分 ( 即 世 ,.,X,/N)。 请 注意 ， 下 标 j 没 有 了 ， 这 是 因为 我 们 省 赂 了 班级 属 
性 ， 即 省 略 了 方程 5.20 中 的 与 班级 相连 的 效应 (AN uw ) o 

这 一 分 析 的 结果 展示 在 表 5. 3 中 的 第 2 列 中 。 结 果 表 明 ， 实 验 组 的 儿童 的 自 
我 能 力 评估 要 显著 地 高 于 控制 组 的 儿童 [yo =0.160, + =2.17，p( 单 尾 ) < 
0.02]。 实 验 组 内 汇合 的 前 测 值 对 后 测 值 的 回归 斜率 为 0.406 (1=7.25, p< 
0.001), 
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分 层 分 析 * 学 生 层次 分 析 * 班级 层次 分 析 “ 
系数 标准 误 系数 标准 误 系数 标准 误 
RE, yo 2.774 0, 084 2. 802 0.063 2.763 0.112 
实验 效应 ，Yo， 0. 188 0.100 0. 160 0. 074 0. 209 0. 135 
MWM, Yio 0. 369 0. 056 0. 406 0. 056 0. 649 0. 223 


一 


注 : a 残 差 方 差 估计 值 : g =0.258: Fo =0.019. 
b. 估计 的 残 其 方差 =0. 273 
估计 的 残 差 方差 =0, 087. 
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对 于 班级 层次 的 分 析 ， 其 模型 为 ; 


Y, = yo + Yo W, + yio( ,~ ¥..) + uo [5.22] 
其 中 , j=1, =, 22 个 班 。 这里， 是 班级 j 的 前 测 平 均 数 ,7., 是 后 测 班 级 


平均 数 。 前 测 的 总 平均 数 T.. 是 班级 平均 数 的 平均 数 ( 即 郊 . = EX). K 
些 结果 列 在 表 5. 3 中 的 第 三 列 。 尽 管 其 实验 效应 的 值 (yo =0.209) 要 大 于 分 
慨 分 析 和 班级 层次 分 析 中 的 估计 值 ， 但 是 它 并 不 显著 ， 因 为 其 标准 误 【se 
(Fo) =0.135] 要 大 得 多 。 协 变量 效应 的 估计 值 (yo =0.649) 及 其 标准 误 
(0. 223) 也 都 要 大 得 多 。 

看 起 来 令 人 惊讶 的 是 ， 分 层 分 析 的 结果 近似 于 学 生 层 次 分 析 的 结果 ， 而 不 
同 于 班级 层次 分 析 的 结果 。 在 这 两 种 情况 下 ， 对 教学 改革 效果 的 检验 统计 量 取 
决 于 两 个 数 的 比 : 固定 效应 的 规模 及 其 标准 误 的 规模 。 下 面 分 别 加 以 比较 
说 明 。 

固定 效应 。 实 验 效应 的 估计 值 在 三 类 分 析 中 都 比较 接近 ， 其 中 学 生 层 次 分 
析 的 估计 值 最 小 (0. 160) ， 班 级 层次 分 析 的 估计 值 最 大 〈0. 209) ， 分 层 分 析 
的 估计 值 居 中 (0. 188) 。 在 这 三 类 分 析 中 ， 实 验 效应 的 估计 都 是 通过 下 面 的 
通用 公式 ; 


Yo = hr, ~ Bre - By (ix, - hre) (5. 23] 


其 中 ,wy, 和 wy 分 别 是 实验 组 和 控制 组 的 后 测 平均 数 的 估计 值 。 三 者 之 间 的 主 
要 差别 在 于 By :及 前 测 和 后 测 平 均 数 的 估计 方法 。 表 5. 4 展示 了 这 些 结果 。 


R54 HMM MA: 多 层 的 、 学 生 层 次 和 班级 展 次 的 分 析 





分 层 分 析 学 生 层 次 分 析 班级 层次 分 析 
Ye 2.968 2. 980 2. 964 
Ye 2.742 2. 754 2. 980 
K 2. 895 2.921 2. 855 
Xe 2.797 2.759 2. 893 
Bia 0.396 0. 406 0.649 


Ya Fa mAr i UN Xe) 0. 188 0. 160 0.209 
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在 学 生 层 次 的 分 析 中 ，B, ,是 实验 组 和 控制 组 组 内 汇合 的 后 测 对 前 测 的 回 
归 系 数 。 分 层 分 析 也 类 似 ， 只 是 B, ,是 存 22 个 班级 中 对 每 个 班级 内 汇合 的 。 
然而 ， 班 级 层次 分 析 是 将 22 个 班级 的 后 测 平均 数 对 前 测 平 均 数 进 行 的 回归 。 
表 5.4 表 明 ，B，, 在 分 层 分 析 (B,., = 0.396) MEEK (B,., = 
0.406) 中 很 接近 ， 而 与 班级 层次 分 析 (B,., =0.649) 有 较 大 差异 。 

这 := 类 不 同方 法 对 实验 分 组 前 测 和 后 测 平均 数 的 估计 方法 也 是 不 同 的 。 我 
们 用 后 测 平均 数 来 举例 ， 在 分 层 分 析 中 是 使 用 加 权 平 均 数 ， 


Je 
YO) = F Ar Ya Das [5.24] 
i 7 


其 中 ,7., ;是 实验 组 中 第 j 个 班级 的 平均 数 ， 权 数 As 是 相应 的 样本 平均 数 的 
精度 。 这 样 ， 分 层 估计 值 就 是 精度 加 权 平 均 数 。 
学 生 层 次 的 估计 值 是 用 样本 规模 加 权 的 : 


Je 
Js( 学 生 层次 ) = Yah Dns (5. 25} 


其 中 ，nrz 是 实验 组 中 第 /个 班级 的 样本 规模 。 
与 此 不 同 ， 班 级 层次 分 析 中 使 用 的 却 是 未 加 权 的 平均 数 : 


Ts( 班 级 层次 ) = DV / Se [5. 26] 


KP, J, 是 实验 组 中 班级 的 数量 。 

当 每 个 班级 平均 数 的 可 靠 性 差异 很 大 时 ， 班 级 层次 的 估计 值 就 有 可 能 不 准 
确 ， 因 为 它 会 受到 班级 平均 数 中 异常 值 的 很 大 影响 ， 而 这 些 异 常 值 的 产生 正 是 
源 于 不 可 靠 性。 但 是 ， 学 生 层 次 分 析 的 估计 值 和 分 层 分 析 的 估计 值 不 会 出 现 这 
种 情况 。 事 实 上 ， 如 果 精 度 4 “已 知 或 能 被 准确 估计 ， 那 么 公 层 分 析 的 加 权 方 
法 是 最 优 的 。 班 级 层次 的 估计 值 只 有 在 样本 平均 数 都 同样 可 靠 的 条 件 下 才 是 合 
理 的 。 

标准 误 。 实 验 效 应 估计 值 的 标准 误 存 这 三 个 分 析 中 也 不 同 。 学 生 层 次 分 析 
中 的 标准 误 估计 0.074 显然 具有 误导 性， 如 前 所 述 ， 模 型 中 没有 考虑 班级 内 部 
观察 值 之 间 的 关联 性 ， 实 际 上 ， 学 生 层 次 分 析 中 假定 了 有 比 实际 情况 更 多 的 信 
息 〔 即 假定 班级 内 每 个 个 人 的 回答 都 提供 一 个 额外 的 独立 信息 )。 但 是 ， 为 什 
么 分 层 模 型 中 的 标准 误 估计 值 (0.100) 会 小 于 班级 层次 分 析 中 的 估计 值 
(0.135) We? 
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除了 样本 规模 ， 协 方差 分 析 模 型 中 两 个 实验 分 组 之 间 差异 的 标准 误 取决 于 
:个 因素 : (a) 未 被 解释 的 因 变量 方差 ， (b) 协 变量 回归 系数 估计 的 精度 ， 
和 (e) 协 变量 在 组 间 差异 的 大 小 。 分 层 分 析 一 般 比 班级 层次 分 析 更 有 效 ， 这 
是 因为 在 因素 (a) 和 (b) 上 更 有 利 。 

对 于 因素 (a) ， 未 被 解释 的 因 变量 方差 在 分 层 分 析 中 更 小 。 第 /个 班级 的 
样本 平均 数 了 .的 方差 为 A, = rw = wz]m 。 在 班级 层次 分 析 中 ， 只 有 rm 有 可 能 
被 协 变量 所 解释 。 在 分 层 分 析 中 ，rm 和 o 都 能 被 解释 。 如 果 在 班级 内 ， 层 -1 
的 协 变量 与 因 变 量 高 度 相 关 ， 那 么 o? 就 会 大 幅度 下 降 ， 其 相 比 于 班级 层次 分 
析 的 优势 就 要 大 得 多 。 

对 于 因素 (b)， 协 变量 效应 估计 的 精度 在 分 层 分 析 中 要 大 于 班级 层次 的 
分 析 ， 因 为 分 层 分 析 使 用 所 有 的 数据 来 估计 协 变量 效应 。 与 此 相对 ， 班 级 层次 
分 析 只 使 用 了 班级 的 前 测 和 后 测 平 均 数 之 间 的 协 变 信息 。 

具体 地 说 ， 如 表 5.3 中 所 显示 的 ， 分 层 分 析 中 的 标准 误 se(B,.;) 一 般 小 
于 班级 层次 分 析 中 的 标准 误 se(B，.，) 。 因 为 实验 效应 的 标准 误 se(7,。) 依赖 于 
标准 误 se(B,.)， 这 一 点 在 方程 5.23 中 可 明显 看 出 。 

总 之 ， 分 层 分 析 在 这 一 应 用 研究 中 有 许多 优点 。 第 一 ， 它 是 一 个 诚实 的 模 
型 。 分 层 模型 考虑 了 班级 内 观察 值 之 间 的 关联 性 ， 而 不 是 错误 地 假定 班级 内 观 
察 值 的 独立 性 。 

第 二 ， 对 于 不 平衡 的 嵌 套 设计 ， 它 提供 对 实验 效应 的 有 效 估计 。 传 统 上 ， 
人 们 建议 用 班级 层次 的 分 析 替 代 学 生 层次 的 分 析 ， 因 为 残 闫 独立 性 假设 不 成 
立 。 然 而 ,研究 人 员 翡 叹 ， 这 种 分 析 虽 然 也 许 更 合适 ， 但 是 其 辨别 各 种 效应 的 
能 力 很 差 ， 正 是 由 于 这 个 理由 ， 研 究 人 员 往 往 并 不 采纳 这 个 建议 。 关 键 的 一 点 
是 ,研究 人 员 再 也 不 必 在 明显 站 不 住 脚 的 模型 ( 即 学 生 层 次 分 析 ) 和 诚实 但 
低 效 的 模型 (班级 层次 分 析 ) 两 者 之 间 进 行 选择 了 。 分 层 线性 模型 能 适当 地 
处 理 嵌 套 设计 中 的 差异 来 源 ， 并 提供 有 效 的 参数 估计 。 

最 后 ， 分 层 模型 能 够 检验 回归 的 同 质 性 ， 并 且 不 管 就 什么 标准 来 划分 结 
果 ， 都 能 提供 较 理想 的 方法 。 在 上 面 的 应 用 中 ， 对 于 班级 来 说 ， 后 测 值 对 前 
测 值 的 回归 就 班级 而 言 是 同 质 的 ， 因 此 我 们 将 协 变量 设 定 为 固定 效应 。 然 
而 ， 如 果 回 归 系数 被 发 现在 班级 之 间 是 变化 的 ， 那 么 我 们 就 会 建立 一 个 模型 
来 预测 这 些 变化 。 在 层 - 1 系数 中 任何 未 被 解释 的 变化 都 可 以 在 实验 的 推断 
中 加 以 考虑 。 
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例 2: 通过 以 截 距 和 斜率 为 因 变量 的 
模型 来 解释 组 织 的 不 同 效应 


在 上 面 讨论 的 例子 中 ， 组 织 特征 对 组 织 内 的 所 有 个 人 都 有 共同 的 影响 。 组 
织 变 最 的 唯一 的 效应 是 改变 因 变 基 的 平均 水 平 ， 而 因 变量 的 分 布 并 不 受 影响 。 
在 这 一 节 ， 我 们 讨论 组 织 特 征 影响 层 -1 变量 的 关系 ， 其 影响 或 者 是 增强 或 者 
是 减弱 这 种 关系 。 针 对 这 类 现象 的 统计 模型 就 是 方程 5. 1 和 5. 2 中 的 完全 分 层 
模型 。 组 织 内 的 关系 表现 在 层 - ! 模型 的 回归 系数 上 ， 组 织 变量 对 这 些 关系 的 
影响 表现 在 相应 的 层 -2 模型 中 ， 


过 去 在 建立 以 斜率 为 因 变 量 的 回归 模型 时 所 遇 到 的 困难 


以 回归 系数 或 斜率 为 因 变量 回归 的 使 用 效果 很 吸引 人 ， 因 为 它 大 大 扩展 了 
组 织 研究 中 可 以 涵盖 的 问题 。 但 不 幸 的 是 ， 一 系列 的 技术 困难 使 得 过 去 存 使 用 
以 斜率 为 因 变量 的 模型 受到 了 限制 。 

第 一 ， 一 般 说 来 ， 回 归 系 数 的 抽样 方差 要 比 样本 平均 数 大 得 多 。 如 果 一 个 
单位 内 的 样本 很 小 ， 那 么 回归 系数 的 估计 就 会 有 很 大 误差 。 这 样 ， 斜 率 的 较 差 
可 靠 性 就 会 削弱 我 们 对 层 -2 模型 中 的 关系 的 判断 能 力 。 当 层 -1 自 变量 的 离 
散 度 受 到 限制 时 ， 这 种 误差 就 会 被 夸大 。 例 如 ， 校 内 各 班 的 学 生 要 比 真正 随机 
抽样 样本 的 学 生 有 更 大 的 同 质 性 ， 其 结果 是 校内 的 社会 经 济 状况 与 成 绩 的 斜率 
估计 的 抽样 方差 就 会 增加 。 这 时 尽管 结构 参数 是 正 的 ， 但 对 一 些 个 别 学 校 来 说 
会 产生 负 的 斜率 估计 (WLP 4.2)。 这 尤其 成 为 问题 ， 因 为 这 些 异 常 值 会 对 
层 -2 的 研究 结果 产生 不 良 影响 。 

第 二 ， 由 于 各 单位 内 收集 数据 的 方法 不 同 ， 斜 率 估计 的 抽样 精度 在 不 同 单 
位 是 不 同 的。 但 是 在 层 -2 分 析 中 常用 的 OLS 估计 方法 却 假设 因 变量 在 不 同 单 
位 之 间 是 等 方差 的 。 忽 略 不 同 单位 之 间 抽 样 精度 的 差异 将 削弱 参数 估计 的 有 效 
性 ， 从 而 进一步 限制 我 们 对 斜率 及 其 层 -2 解释 变量 之 间 关 系 的 判断 能 力 。 

第 三 ， 斜 率 估计 的 总 方差 包括 两 个 部 分 。 其 中 之 一 是 ， 不 同 组 织 之 间 的 斜 
率 参数 可 能 的 确 有 差异 。 在 斜率 估计 中 ， 区 分 这 一 参数 方差 和 误差 方差 是 最 基 
本 的 。 当 我 们 想 要 阶 述 层 - 2 模型 的 结果 时 ， 这 尤其 重要 。 正 如 前 面 所 提 到 
的 ， 只 有 层 -1 系数 的 参数 方差 才 有 可 能 被 层 -2 自 变量 解释 。 在 许多 情况 下 ， 
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由 于 上 述 原因 ， 观 测 的 斜率 方差 在 很 大 程度 上 是 误差 方差 。 于 是 层 -2 模型 只 
能 解释 回归 斜率 观测 方差 中 的 很 小 一 部 分 ， 使 层 -2 模型 的 解释 力 看 上 去 打 了 
折扣 ， 厕 就 理论 上 可 能 被 解释 的 方差 而 言 ， 实 际 上 它 已 经 解释 了 很 大 的 部 分 。 
不 六 的 是 ， 简 单 地 以 斜率 为 因 变 最 的 模型 不 能 在 这 方面 发 挥 作用 。 

第 四 ， 要 将 多 个 斜率 作为 因 变 量 纳入 层 -2 模型 ， 需 要 考虑 存在 于 每 个 
层 -2 单位 的 多 元 回归 系数 估计 值 之 间 特 殊 的 协 方差 结构 。 缺 少 这 样 一 个 模型 
就 会 导致 精度 进一步 被 削弱 

第 五 ， 在 许多 应 用 中 ,组 织 成 员 的 样本 量 并 不 支持 对 每 个 组 织 的 常规 最 小 
二 乘 回 归 。 如 果 某 个 组 织 的 样本 规模 太 小 ， 或 者 这 个 样本 不 随 某 一 不 而 变化 ， 
那么 就 不 可 能 对 回归 进行 计算 。 如 果 应 用 以 斜率 为 因 变量 的 回归 ， 这 样 的 组 织 
就 必须 舍弃 ， 于 是 又 有 可 能 使 样本 偏差 加 大 及 精度 下 降 。 而 用 最 大 似 然 估 计 分 
层 模型 时 ， 这 样 的 组 织 就 没有 必要 舍弃 。 


例子 : 公立 和 天 主教 学 校 成 绩 的 社会 分 布 


Lee 和 Bryk (1989) 使 用 “高 中 及 以 上 学 校 调查 ”数据 的 一 个 子 样本 ， 
与 第 4 章 中 使 用 的 样本 类 似 ， 用 分 层 分 析 检 验 了 是 否 天 主教 学 校 学 习 成 绩 上 的 
社会 阶层 分 布 要 比 公立 学 校 更 公平 。 具 体 地 说 ， 他 们 抽 了 -- 个 74 所 天 主教 学 
校 的 样本 和 一 个 86 所 公立 学 校 的 随机 子 样本 ， 将 这 两 批 学 生 合 在 一 起 以 增加 
层 -1 的 样本 规模 n， 总 样本 规模 N 达到 10999 名 学 生 。 表 5.5 描述 了 有 关 的 
分 析 变 量 。 下 面 我 们 将 讨论 他 们 的 分 析 逻 辑 ， 阑 明 如 何 使 用 以 截 距 和 斜率 为 因 
变量 的 模型 来 解释 在 天 主教 学 校 和 公立 学 校 学 习 成 绩 的 社会 分 布 。 

随机 效应 方差 分 析 模 型 。 这 项 分 析 以 建立 一 个 单 因素 随机 效应 方差 分 析 模 
型 开始 ， 以 确定 校内 和 学 校 间 因 变量 (高 年 级 数学 成 绩 ) 的 总 变化 。 平 均 的 
学 校 平 均 数 yo 为 12. 125。 汇 合 的 校内 方差 或 称 层 -1 F% 0 Hy 39.927, 在 J 
个 学 校 平 均 数 之 间 的 方差 fm 为 9.335。 用 这 些 结果 和 方程 4.6， 我 们 就 可 以 估 
计 学 校 间 方程 比例 ( 即 组 内 相关 ) 为 0.189。 我 们 注意 到 ， 随 机 效应 方差 分 析 
模型 中 估计 的 o 表示 层 - 1 的 总 方差 。 我 们 在 下 面 将 要 看 到 ， 随 着 在 层 - 1 模 
型 中 引进 各 自 变 量 ， 有 一 部 分 方差 得 到 了 解释 。 

随机 系数 回归 模型 。 下 一 步 是 建立 一 个 反映 ) 个 学 校 成 绩 的 社会 分 布 的 模 
AY, SUR Mi, EA -1 (学 生 模 型 )， 第 j 个 学 校 中 的 第 i 个 学 生 的 数学 成 绩 
(Y) 对 其 种 族 (MINORITY)、 社 会 经 济 状况 (SES) 和 学 业 背 景 (BACK- 
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GROUND) 进行 回归 : 


Y, = By +B,,( MINORITY), + B,(SES), +B,(BACKGROUND), +r, [5.27] 


RSS 公立 和 天 主教 学 校 数学 成 绩 的 社会 分 布 研究 中 的 有 关 变量 
(Lee & Bryk, 1989) 








EME | i $ 
学 生 层次 es Bee a 
数学 成 绩 (MATH ACHIEVEMENT) | 高 年 级 数学 测试 (平均 数 =12.92， 标 准 差 =6.70) 。 
社会 经 济 状态 (SES) | 社会 经 济 状况 的 合成 度 身 .在 样本 中 ， 平 均 数 接近 0， 标准 
项 为 0.8 
种 族 (MINORITY) 虚拟 变量 (1 = 黑人 或 西班牙 商 ; 0 = 其他)。 


| 学 生 高 中 之 前 的 学 业 背 景 。 它 包括 小 学 时 的 负 级 情况 、9 年 
| ”级 参加 补习 班 的 信息 、 进 入 高 中 时 的 期 望 。 这 是 一 个 标准 
化 指标 (平均 数 =0; 标准 差 =1.0)。 


学 业 背 好 (BACKGROUND) 


学 校 层次 
学 校 类 别 (SECTOR) 效应 编码 变量 (1 -= 教会 ，- 1 = 公立 )。 
平均 社会 经 济 状况 (AVSES) 校内 学 生 社会 经 济 状 阅 的 平均 数 〔 即 学 校 的 平均 SES) 。 
种 族 (HIMNRTY ) 效应 编码 变量 (1 = 少数 种 族 注 册 学 生 超过 40% ; -1 = 未 起 





过 ) 


平均 学 业 背 景 (AVBACKCRD) 校内 学 生 学 业 背 景 平均 数 ( 即 学 校 平均 的 BACKGROUND) 。 


TE; AVSES 和 AVBACKGRD 是 从 比 本 例 使 用 的 一 个 更 大 的 样本 中 计算 的 。 


请 注意 ,7, 的 方差 0 现在 是 层 -1 上 考虑 了 学 生 的 种 族 状况 、 社 会 经 济 状 
况 和 学 业 背 景 后 尚未 解释 的 残 差 方 差 。 

每 个 学 校 的 成 绩 分 布 用 四 个 参数 表示 : 一 个 截 距 和 三 个 回归 系数 。 变 量 
MINORITY SES 和 BACKGROUND 都 是 以 组 平均 数 对 中 的 〈 见 第 2 章 ) 。 这 四 
个 参数 可 以 解释 如 下 : 


Bw 是 第 j 个 学 校 的 平均 成 绩 ; 

Bu 是 第 j 个 学 校 的 种 族 差异 〈 即 白人 和 人 少数 种 族 学 生成 绩 的 平均 差异 ) ; 

pu, 是 第 了 个 学 校 的 社会 经 济 状况 的 差别 效应 ( 即 学 生 的 社会 经 济 状况 差异 
与 高 年 级 成 绩 的 关系 强度 ) ; 

B, 是 第 /个 学 校 的 学 业 背 景 的 差别 效应 〈 即 学 生 的 学 业 背 景 差异 与 高 年 级 
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成 绩 差 异 的 关系 强度 ) 

各 个 分 布 效应 Bu 、B, By 和 B, 都 是 在 控制 了 其 他 自 变量 以 后 的 净 效 应 。 
例如 ， 第 j 个 学 校 的 种 族 差异 B,, 是 在 控制 学 生 的 社会 经 济 状况 SES 和 学 业 背 景 
BACK GROUND 以 后 的 白人 和 少数 种 族 学 生成 绩 差 异 的 调整 平均 数 。 

就 这 一 模型 而 言 ， 一 个 有 效 而 公平 的 学 校 应 该 是 平均 成 绩 较 高 ( 即 Bo 是 

-个 较 大 的 正 值 )、 种 族 差异 较 小 ( 即 B, 接 近 于 0)， 以 及 社会 经 济 状 况 及 学 
业 背 景 的 差别 效应 较 弱 〔 即 B, 和 ps, 分 别 都 是 较 小 的 正 值 ) 。 
方程 5.27 中 的 4 个 系数 在 层 -2 模型 中 都 被 设 定 为 随机 的 。 具 体 地 说 就 是 : 


B, = yn + My, 其 中 g = 0,1,2,3 [5.28] 


其 中 ，yo。 是 每 一 学 校 效应 的 平均 数 。 白 于 有 4 个 层 -2 的 随机 效应 ， 它 们 的 方 
差 和 协 方差 就 形成 了 一 个 4 x4 的 矩阵 ; 


Var( ug ) 对 称 Too 对 称 
Ta Cov( u, te) Var( u, ) = Tio Fu 

Cov( u, stip) Cov(u, san) Var( uy) Tw Tu Tn 

Cov( wy ty) Cov(u,.u,) Cov(uy uy) Var(u,) Ty. Tu Tu Tsp 


方程 5. 27 和 35.28 所 表示 的 随机 效应 回归 模型 代表 的 假设 是 成 绩 的 社会 分 
布 在 J 个 学 校 之 间 是 不 同 的 。 如 下 面 将 要 阐述 的 ， 矩 阵 T 的 对 角 线 上 的 元 素 提 
供 了 经 验 数据 ， 可 以 用 来 检验 这 -- 假 设 。 

一 般 情 况 下 ， 随 机 系数 回归 模型 是 分 层 分 析 中 很 重要 的 第 一 步 。 它 的 结果 可 
以 指导 层 -1 方程 的 最 终 设置 ,并 为 屋 -2 模型 的 建立 提供 一 系列 有 用 的 统计 量 。 

表 5.6 显示 了 Lee 和 Bryk (1989) 的 分 析 结 果 。 在 随机 效应 方差 分 析 中 ， 
学 校 平均 成 绩 的 估计 值 为 12. 125， 种 族 差异 平均 数 yo 为 -2.78 分 。 这 说 明 ， 
在 一 个 各 方面 处 于 平均 的 学 校 里 ， 如 果 学 业 背 景 和 社会 背景 相当 ， 少 数 种 族 学 
生 比 白人 学 生 低 2.78 分 。 同 样 ， 学 生 的 社会 经 济 状况 和 学 业 背 景 (分别 为 yw 
和 ?yw) 与 学 习 成 绩 是 正 相关 的 。 这 说 明 在 一 个 平均 水 平 的 学 校 ， 那 些 更 富有 
和 以 前 学 习 更 好 的 学 生 在 高 年 级 时 数学 成 绩 更 好 。 报 告 的 上 值 很 大 ， 表 明 
层 -1 自 变量 的 统计 性 都 很 显著 。 

层 -1 和 层 -2 随机 效应 方差 的 估计 值 (o? 和 7,,) 显示 在 表 5.6 的 第 二 
组 数据 中 。 请 注意 ， 在 控制 了 学 生 的 种 族 状况 、 社 会 经 济 状况 和 学 业 背 景 后 ， 
层 -1 方差 已 经 由 随机 效应 ANOVA 模型 中 的 39. 927 下 降 到 31.771。 方 差 被 这 
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个 层 -1 模型 所 解释 的 比例 为 : 


(39.927 - 31. 771 )/39. 927 = 0. 204 


E56 数学 成 线 社 会 分 布 的 随机 系数 回归 模型 














国定 效应 系数 标准 误 se e fi 

学 校 平 均 成 绩 , yo 5 0252 a820 

PH., Yio -2.780 0. 242 -11.515 

SES BY. Yw 1,135 0. 104 10, 882 

FW. yw 2. 582 0. 093 27.631 

随机 效 点 方差 成 分 自由 度 df x pifi 
PRM, uy — aas B37 no 70 0000 

POR IEE, u, 1.367 137 161.01 0. 079 
SES HH, u, 0. 360 137 173. 39 0.019 
FRH. wy 0, 496 137 219. 02 0. 000 
AERE. EEA 31.771 

学 校 效 应 之 间 的 相关 程度 平均 成 绩 BE SES a 5¢ 

a 0. 397 o l 

SES Ji + 0. 182 -0. 109 

学 业 差 并 0.327 0. 085 0, 652 
OLS EH BHATT BY a RTE 
RRM 0.922 

HRH 0. 098 

SES #% f 0. 167 

学 业 差异 0. 330 





随机 系数 回归 模型 层 -2 方差 的 估计 值 提供 了 学 校 间 成 绩 的 社会 分 布 变化 
的 经 验证 据 。 对 这 些 层 - 2 随机 效应 的 方差 同 质 性 检验 能 够 用 来 检验 成 绩 的 社 
会 分 布 结构 在 学 校 间 是 否 有 差别 ， 即 拒绝 下 面 的 假设 : 


H,:Var(u,) = Var(B,) = 0， 其 中 9 = 0,1,2,3 [5.29] 
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则 意味 着 学 校 间 的 成 绩 分 布 是 有 差别 的 。 

就 单 参 数 的 检验 而 言 ， 在 同 质 性 假设 下 ， 对 于 平均 成 绩 和 学 业 差 异 的 
系数 ,估计 的 变化 概率 小 于 0.001; 而 对 于 SES 差异 ， 其 概率 小 于 0. 02。 种 族 
差异 系数 的 斜率 同 质 性 假设 的 p 值 接 近 临 界 点 (0.079)。 不 过 ， 由 于 以 往 研 究 
已 经 发 现 不 同类 型 学 校 之 间 少 数 种 族 学 生 在 成 绩 上 的 巨大 差异 ， 因 此 就 保持 这 
-效应 为 随机 效应 - 

我 们 注意 到 这 些 x* 检验 只 能 提供 近似 的 概率 值 ， 其 原因 有 二 : 第 一 ， 它 
们 只 是 简单 的 单 参数 检验 ， 因 为 在 模型 中 并 没有 考虑 其 他 的 随机 效应 。 第 二 ， 
它们 的 估计 只 是 根据 那些 有 足够 数据 计算 OLS 回归 的 学 校 。 在 这 种 情况 下 ， 
160 所 学 校 中 只 有 138 所 能 被 利用 ， 而 其 余 的 22 所 在 种 族 状况 上 没有 差别 ， 这 
就 是 为 什么 表 5.6 中 第 二 组 的 自由 度 df = 137, 

当 我 们 产生 怀疑 时 ， 可 以 利用 所 有 数据 的 多 元 似 然 比 (见方 程 3. 105 和 
3.107) 来 交叉 检验 这 些 单 变量 的 同 质 性 。 具 体 地 说 ， 完 全 的 随机 系数 回归 
模型 的 偏差 度 deviance 可 以 与 其 简化 模型 比较 ， 比 如 ， 只 有 一 个 随机 截 距 的 
模型 ; 


Bo, = Yoo + ty [5.30] 
By = yw， 其 中 4 = 1,2,3 


在 Lee 和 Bryk (1989) 的 数据 中 ， 完 全 的 随机 系数 回归 模型 的 偏差 度 为 
58248.4， 自 由 度 为 11 。 在 简化 模型 中 〈( 所 有 的 回归 斜率 都 设置 为 固定 效应 ) , 
其 值 为 58283.6， 自 由 度 为 2。 其 结果 ， 似 然 比 检验 统计 量 为 35. 2， 自 由 度 为 
9 (p<0.001)， 这 就 确认 了 分 布 效应 在 学 校 间 是 不 同 的 。 

随机 系数 回归 模型 的 可 能 值 (plausible value) 估计 (见方 程 4.19) 提供 
了 有 用 的 描述 性 统计 来 说 明 学 校 同 在 平均 成 绩 、 种 族 差 异 大 小 和 社会 及 学 业 差 
别 效应 上 的 实际 变化 幅度 。 在 正 态 分 布 假定 下 ,我 们 可 以 期 望 和 95% 的 学 校 
的 这 些 效 应 都 在 下 面 的 区 间 内 : 


Yo + 1.96(7,,)'? [5.31] 


这 样 ， 在 这 个 高 中 及 以 上 调查 数据 中 ， 学 校 平均 数 (By) 可 以 期 望 在 
(6.140, 18.110) 范围 内 ， 种 族 差异 (B,) 主要 在 ( -5.072，-0.488) 内 ， 
社会 和 学 业 差 别 效应 分 别 在 (-0.041, 2.311) 和 (1.202, 3.962) 之 间 。 
显然 ， 这 些 结果 表明 每 个 效应 在 学 校 间 的 差异 都 很 大 。 有 趣 的 是 ， 我 们 可 以 期 
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望 发 现 一 些 学 校 少数 种 族 学 生 的 成 绩 与 白人 一 样 ， 而 社会 差别 效应 很 小 一 一 因 
为 B, 和 8B, 的 值 接近 0 是 很 可 能 的 。 然 而 ， 所 有 学 校 似乎 都 存在 一 定 程度 的 学 
业 背 景 效应 差别 一 一 因为 B, 的 值 为 0 似乎 不 太 可 能 。 我 们 注意 到 ， 那 些 可 能 
值 是 就 实际 的 学 校 参 数 B, 而 言 的 ， 而 不 是 就 分 别 的 OLS 估计 的 参数 语 而 言 的 。 
OLS 估计 值 ， 尤 其 是 回归 斜率 ， 由 于 这 些 个 别 学 校 参数 的 样本 估计 值 的 不 可 靠 
性 ， 会 有 很 大 差别 。 

可 以 从 层 -2 方差 协 方差 成 分 中 计算 的 另 一 类 有 用 的 描述 性 统计 是 学 校 效 
应 之 间 的 相关 系数 。 对 于 任何 两 个 随机 效应 u, 和 wu,,( 或 者 与 此 等 价 的 随机 系 
数 回 归 模 型 中 的 B, 和 B,,)， 有 : 


PU My) = Faf (Byte)? [5.32] 


wee 


这 些 结果 显示 在 表 5.6 的 第 3 组 数据 中 。 与 学 习 成 绩 较 低 的 学 校 相 比 ， 学 习 成 
绩 较 高 的 学 校 一 般 种 族 差异 较 小 (pw = 0.397)， 但 社会 经 济 状况 (fy = 
0.182) 和 学 业 背 景 (pu =0.327) 差异 略 大 。 有 趣 的 是 ， 社 会 和 学 业 上 差别 
效应 的 相关 系数 为 0. 652 ， 表 明 这 两 个 学 校 效 应 可 能 具有 共同 的 原因 。 

- 般 说 来 ， 考 察 随机 系数 回归 模型 中 估计 的 相关 系数 是 重要 的 。 尽 管 在 上 
面 的 例子 中 ， 社 会 和 学 业 上 差别 的 相关 系数 较 高 ， 但 仍然 有 足够 大 的 独立 变化 
可 以 把 它们 看 作 是 不 同 的 学 校 效 应 。 在 本 书后 面 所 讨论 的 例子 中 ， 还 发 现 相关 
系数 高 达 0. 90 及 以 上 。 在 这 种 情况 下 ， 两 个 随机 效应 实际 上 反映 的 是 层 -2 
单位 之 间 的 同一 种 变化 。 我 们 就 可 以 有 把 握 地 将 这 个 模型 简化 ， 把 这 两 个 
层 -1 效应 之 一 设 定 为 固定 效应 或 非 随机 变化 效应 。 根 据 理论 和 研究 目的 ， 可 
以 得 知 其 中 蛙 一 个 更 重要 ， 应 设置 为 随机 效应 。 

表 5.6 还 报告 了 这 些 层 -2 随机 效应 的 可 靠 性 指标 。 在 随机 系数 回归 模型 
中 ， 它 们 等 价 于 真实 参数 B, 的 OLS 估计 值 ,的 可 靠 性 。 这 些 可 靠 性 的 计算 是 
用 估计 值 代 入 方程 3.59 中 的 层 -1 和 层 -2 的 方差 成 分 。 我 们 注意 到 ， 这 些 统 
计量 ， 像 好 同 质 性 检验 统计 量 一 样 ， 使 用 了 对 每 个 层 -2 单位 分 别 做 的 OLS fi 
计 。 所 以 在 本 例 中 ， 它 们 是 根据 138 个 学 校 计算 的 。 

随机 系数 回归 模型 的 可 靠 性 估计 有 助 于 提供 更 多 信息 来 指导 对 层 -1 系数 
的 恰当 设置 ( 即 固定 的 、 随 机 的 或 非 随机 变化 的 效应 ) 。 由 于 r, 的 计量 取决 于 
相应 XA 六 的 计量 ， 在 解释 ru 的 绝对 值 时 要 多 加 小 心 。 这 一 可 靠 性 提供 了 另 
外 一 种 数据 所 显示 的 信息 量 的 指标 ， 即 它 告诉 我 们 观察 到 的 后 差异 中 有 多 少 
可 以 得 到 解释 。 过 去 使 用 这 些 方法 的 经 验 表 明 ， 当 层 -1 随机 系数 的 可 靠 性 降 
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到 0.05 时 ， 这 一 系数 就 可 以 设置 为 固定 的 或 非 随机 变化 的 效应 。 

这 些 统计 最 还 有 助 于 考察 某 一 数据 中 用 来 检验 结构 效应 假设 的 功效 中 ， 对 
于 “高 中 及 以 上 ”数据 ， 我 们 有 很 大 的 功效 来 检验 学 校 特 征 对 学 校 平均 成 绩 
影响 的 假设 ， 因 为 截 距 估计 很 可 靠 。 然 而， 这 个 数据 对 于 考察 学 校 特 征 对 不 同 
种 族 学 生 相 对 成 绩 的 影响 却 不 太 有 用 。 如 上 所 述 ， 有 22 所 学 校 在 这 方面 没有 
信息 ， 还 有 一 些 学 校 的 信息 也 很 有 限 。 这 说 明 . 我 们 在 做 对 于 不 同 种 族 学 生 的 
相对 成 绩 上 “学 校 特征 并 不 重要 ”这 样 的 推断 时 要 非常 小 心 。 可 靠 性 系数 告 
诉 我 们 ， 这 些 数据 并 未 给 这 样 的 推断 提供 充分 证 据 。 简 而 言 之 ,它们 提醒 我 们 
在 确认 一 个 虚无 假设 时 ， 不 能 过 于 热情 。 

以 截 距 和 镍 率 作 为 因 变 量 的 模型 学校 类 别 和 环境 的 影响 。 随 机 系数 回归 
模型 的 结果 表明 ， 平 均 而 言 ， 每 个 层 -1 的 自 变量 和 数学 成 绩 都 有 显著 的 关系 
(这 一 判断 是 根据 固定 效应 的 估计 值 及 其 标准 误 和 4 值 )。 因 此 ， 每 个 自 变量 都 
应 保留 在 学 生 层 次 模型 中 ， 至 少 可 作为 周 定 效 应 。 另 外 ，7,, 的 点 估计 、 同 质 
性 的 检验、 似 然 比 检验 以 及 可 靠 性 统计 量 都 表明 ， 各 个 层 -1 回归 系数 在 学 
校 之 间 有 足够 大 的 差异 ， 至 少 可 以 开始 将 这 些 系数 设置 为 随机 效应 。 

Lee 和 Bryk (1989) 下 一 步 建立 了 一 些 解释 性 模型 来 饥 明 学 校 间 组 织 特征 
的 差异 是 如 何 影响 学 校内 成 绩 的 社会 分 布 的 。 其 中 一 个 模型 假设 学 校 在 类 别 和 
构成 方面 存在 差别 效应 。 他 们 注意 到 无 论 是 天 主教 学 校 还 是 公立 学 校 ， 学 生 构 
成 都 有 很 大 差异 ， 因 此 即使 是 在 层 -1 模型 中 控制 了 学 生 的 个 人 特征 后 ， 这 些 
环境 差异 也 可 能 影响 因 变 量 (关于 组 织 研究 中 的 构成 效应 这 一 点 将 在 后 文中 
更 详细 地 讨论 )。 这 样 ， 他 们 拟 合 了 学 校 类 别 和 环境 变量 (如 表 5.5 中 学 校 的 
平均 社会 经 济 状况 、 种 族 差 异 和 平均 学 业 背 景 ) 对 平均 成 绩 、 少 数 种 族 、 社 
会 差别 和 学 业 背 景 差 别 上 的 联合 效应 。 他 们 还 假设 这 些 环境 影响 在 两 类 学 校 中 
的 影响 是 不 同 的 。 因 此 ， 他 们 将 SECTOR 和 各 环境 变量 的 交互 影响 作为 自 变 最 
纳入 层 -2 模型 中 。 

他 们 的 层 - 1 模型 还 是 方程 5. 27， 并 建立 了 下 列 层 - 2 模型 : 


Bo, = Yoo * Yo: ( AVSES), + Yo ( HIMNRTY), +7yo(AVBACKGCRD)， 
+ Ym (SECTOR), + Yas (SECTOR x AVSES), + Yos (SECTOR x HIMNRTY ), 





DO PRE: 功效 (power) WAR ARI AA EER ee AE, UPB, JEH 8 为 假设 
检验 中 的 第 二 类 错 襄 的 概率 。 第 二 类 错误 即 弃 真 错误 - 





1200 分 层 线性 模型 ， 应 用 与 数据 分 析 方 法 


+ Yo (SECTOR x AVBACKGRD) +uw 
By, = Yia + Yn CHIMNRTY ), + y,,( SECTOR), 

+yn (SECTOR x HIMNRTY ), +u, [5.33] 
Bs, = Yw + Yn (AVSES), + yn (SECTOR), + yn ( SECTOR x AVSES), + u, 
By = Ym + Yu (AVBACKGRD), + yu (SECTOR), 

+ ys (SECTOR x AVBACKGRD), + u, 


ik BOE BY BE RH, A 28 BAAD Yas Yos Yus 
Yn、Yu 和 ys)。 将 相应 的 层 -2 自 变 基 删除 ， 得 到 一 个 简化 的 模型 。 其 结果 
展示 在 表 5.7 中 ， 并 在 下 面 加 以 讨论 

学 校 平均 成 绩 。 学 生 的 平均 学 业 背 景 (AVBACKCRD) 与 学 校 的 平均 成 绩 
EHX (Yo =1.301, 1=2.514)。 少 数 种 族 学 生 集中 的 学 校 ， 平 均 成 绩 要 低 
一 些 (yo = -1.488，! = -2.699)。 平均 社会 经 济 状况 (AVSES) 对 学 校 平 
均 成 绩 的 影响 在 两 类 学 校 之 间 是 不 同 的 。 也 就 是 说 ， 存 在 一 个 显著 的 交互 效应 
(yu = -1.572，! = -3.642), 在 天 主教 学 校 ，AVSES 和 学 校 平均 成 绩 之 间 的 
关系 为 2.534 [ 即 yo + (1)yos =4. 106 -1.572]。 在 公立 学 校 ， 这 一 关系 要 强 
得 多 ， 为 5.678 [ 即 yo +( —1) Ys =4. 106 + 1.572], 

这 种 交互 效应 的 存在 表明 学 校 类 别 的 影响 程度 取决 于 所 比较 学 校 的 社会 经 
济 状 况 。 一 般 而 言 ， 学 校 类 别 对 平均 成 绩 的 影响 为 : 


大 主教 学 校 预 测 值 - 公立 学 校 预 测 值 
=(1)7ou+(1)(AVSES)(yu) - (0-1) oq + C= 1) CAVSES) (Yes) ] 
=2 [Yo + (AVSES), (yu)] 


对 于 那些 处 于 平均 社会 经 济 状 况 的 学 校 (AVSES =0)， 学 校 类 别 的 影响 为 
1.432 分 ， 即 2 [yu + (0)yYos]。 天 主教 学 校 的 优势 在 社会 经 济 状况 较 低 的 学 
校 要 大 一 些 ， 例如， 如 果 AVSES = -1.0, 那么 学 校 类 别 的 影响 就 是 4.576 分 ， 
即 2 [yu + (一 1)Yos]， 而 对 于 较 富 裕 (EI AVSES >1) 的 公立 学 校 ， 平均 数 
学 成 绩 反 而 要 高 一 些 。 

种 族 差异 。 在 不 同类 别 的 学 校 中 ,种族 差异 的 效应 也 是 不 同 的 (3,, = 
0.721 ,t=2.816)。 在 一 个 平均 水 平 的 天 主教 学 校 ， 少 数 种 族 学 生 要 比 白人 学 
生 低 2.173 分 [ER Fuat (jl (这 是 控制 学 生 的 社会 经 济 状 况 和 学 业 背 景 
之 后 的 净 效 应 ) 。 在 一 个 平均 水 平 的 公立 学 校 ， 种 族 差异 效应 为 3.615 分 
CETELE AR 
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RST 部 门 和 控制 变量 对 成 绩 的 杜 会 分 布 的 影响 估计 








CER U 系数 标准 误 se + 比率 
学 校 六 均 成 续 — 

AA CBASE) 、ym 13. 678 0. 186 73. 393 

半 均 社会 经 济 状况 (AVSES). Yo 4.106 0. 493 8.327 

种 能 区 外 CHIMNRTY ) yas -1.488 0.551 -2,699 

YORE AKA He C AVBACKRGRD), yp 1.301 0,517 2.514 

“FRAY (SECTOR), Yos 0.716 0.194 3. 700 

Z MA (SECTOR x AVSES), Yas -1,572 0. 432 -3.642 
FAK OG St 

MAE (BASE] yw ~2, 894 0. 256 -11.300 

ERR (SECTOR), yy 0,721 0. 256 2.816 
村 会 阶层 差异 

WR (BASE), yw 1,381 0. 14) 9.819 

TBH Peet RAR CAVSES). ya 0. 131 0. 325 0.402 

学 校 类 别 (SECTOR), yn ~0. 362 0.141 -2.571 

XE ty Mt (SECTOR x AVSES}. ys, - 0, 869 0. 325 -2.671 
PR 

ARHI (BASE), Ya 2.482 0.093 26, 650 

学 校 类 别 (SECTOR), yy 0.072 0,093 0.778 
随机 效应 方差 而 分 A IE df x pii 
FRM 2. 681 132 o 631.19 0.000 
HiH 0. 624 136 151, 04 0.179 
SES YF 0,218 134 159. 94 0.063 
TM APR 0.475 136 221. 70 0. 000 
Bet = 1 BNE, ry 31.778 





社会 经 济 状况 差 六。 一 个 学 校内 的 社会 经 济 状况 差别 效应 同时 取决 于 平均 
社会 经 济 状况 和 学 校 的 类 别 。 估计 的 交互 效应 ,要 比 相 应 的 主 效应 加 M ng BB 
大 。 在 公立 学 校 ， 学 生 的 社会 经 济 状况 差异 在 社会 经 济 状况 好 的 学 校 要 大 于 社会 
经 济 状况 差 的 学 校 。 而 在 天 主教 学 校 则 正好 相反 : 社会 经 济 状况 好 的 学 校 社会 
差异 性 小 于 社会 经 济 状况 差 的 学 校 。 这 一 点 可 以 根据 Ja + (SECTOR) 7,, 3} 5 
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计算 出 大 主教 学 校 和 公立 学 校 站 均 社 会 经 济 状况 (AVSES) 对 学 生 SES 22 
效应 的 影响 ,使 可 以 看 出 来 ”对 于 公立 学 校 而 言 、AVSES 的 影响 是 0. 131 + 
( ~1)( -0.869) =1.000. 对 于 天 主教 学 校 而 言 ，AVSES 的 影响 是 0. 131 + 
(1)( -0.869) = -0.738 

学 业 背 景 差 并 ， 对 于 学 业 背 巢 差 异 ， 没有 证 据 表明 存在 环境 、 类 别 以 及 两 
者 的 交 开 效应 

辅助 统计 量 ， 表 5.6 最 下 面 的 … 组 数据 中 显示 了 了 层 -1 和 层 -2 W y 
环境 效应 模型 中 估计 的 方差 成 分 ， 层 -1 的 方差 估计 值 o* 和 随机 系数 回归 模 
型 的 儿 乎 一 样 ， 这 是 预料 中 的 ， 因 为 其 层 -1 模型 是 相同 的 。 一 般 说 来 ，C: 估 
计 值 会 有 细小 的 故 别 ， 因 为 所 有 的 固定 效应 和 随机 效应 是 同时 估计 的 ， 而 且 每 
个 参数 的 估计 都 依赖 于 其 他 各 参数 

在 层 -2， 各 7w 估 计 值 都 是 条 件 方差 ， 或 称 残 差 方 差 ， 即 u, 是 未 被 模型 中 
层 -2 自 变量 所 解释 的 学 校 残 差 效 应 。 相 反 ， 每 个 与 随机 系数 模型 相 联 系 的 7,， 
都 是 非 条 件 方差 。 将 条 件 方差 ( 表 5.7) MERNÉ (485.6) 对 比 ， 可 以 
发 现在 控制 学校 类 别 和 环境 后 、 削 减 方差 的 幅度 很 大 。 计 算 被 层 -2 模型 与 
环境 模型 所 解释 的 方差 比例 ， 应 几 方 程 4.24， 即 ; 


B. 方差 的 解释 比例 = [7,,( 夺 条 件 ) ~ Fo RE n (无 条 件 ) 


【上述 结果 显示 在 表 5.8 中 。 平 均 成 绩 、 种 族 差异 和 社会 经 济 状况 差异 的 方 
差 很 大 -- 部 分 都 得 到 了 解释 而 学 校 间 学 业 背 景 差 异 的 方差 则 基本 上 没有 得 到 
解释 。 由 于 学 业 背 景 差 异 效应 的 可 靠 性 较 高 ( 表 5.6 中 的 0.330) ， 我 们 可 以 
比较 有 把 握 地 认为 ， 学 业 背 虹 效 应 虽然 有 很 大 差异 ， 但 可 能 与 学 校 类 别 或 环境 
ER, WES HWM AR AK HE, Lee 和 Bryk (1989) 随后 的 分 析 将 By 
FA BB 2 SP Eg ER A E RAE Be 28S YT ET — BB, 


表 5.8 被 解释 的 方差 比例 的 最 终 模型 














平均 成 缚 PIR a St 社会 阶层 FAR 
模型 Var (By) Var (B) Var (By) Var (8y) 
i LAIEN - aas 1.367 ai 0.360 0. 496 
AERO 2.681 0. 624 0.218 0.475 
Ei PEA Jy A e A 72 54.4 39.4 4.2 
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HRK 5. 7， 我 们 注意 到 种 族 差异 和 SES 差别 效应 的 好 统计 基 与 这 两 
PAF BEAL OY FR XE IT PEABO O 的 假设 是 一 致 的 。 当 然 ， 这 些 结果 并 不 表明 这 
- 虚 克 假设 是 成 立 的 。 内 为 研究 人 员 有 理论 上 的 理由 去 考察 这 些 分 布 效 应 是 
查 随 着 学 校 组 织 和 规范 环境 厕 变化， 于 是 他 们 扩大 了 层 -2 的 自 变量 范围 ， 
对 4 个 学 校 的 随机 效应 估计 了 新 的 模型 。 许 多 假设 的 组 织 关 系 被 证 实 。 关 键 
的 一 点 是 截 距 和 斜率 的 同 质 性 检验 只 能 作为 一 种 指导 ， 而 不 能 去 代替 知情 
判断 


层 -1 既 有 随机 斜率 又 有 固定 斜率 的 应 用 实例 


为 了 清楚 地 说 明 问题 、 本 章 是 按 两 类 应 用 实例 来 组 织 的 。 在 实例 ! 中 ， 只 
有 戴 中 参数 随 不 同 组 织 变 化 ， 而 层 -1 自 变量 即使 有 也 都 设置 为 固定 效应 。 在 
上 而 刚刚 讨论 的 实例 2 中 ， 所 有 层 -1 系数 都 设置 为 随机 效应 。 事 实 上 ， 有 许 
多 情况 可 以 适用 层 -1 系数 为 随机 效应 和 固定 效应 并 存 的 模型 。 例 如 ， 假 设 我 
们 有 一 个 随机 变化 的 层 -1 斜率 Bu 和 一 系列 作为 协 变量 引入 的 层 -1 自 变量 : 


Y, = Bo, +B, Xy- X,,) + IAEA ~X Ar [5.34] 
Iž -2; 
By = yo + Err, + 9=0,! [5.35a] 
以 及 
By = Ye q 22.0 (5. 35b] 


其 中 ，us 和 uw。, 服 从 平均 数 为 0、 方 差分 别 为 7w 和 7,,、 协 方差 为 r 的 双 变 量 
正 态 分 布 。 

在 这 个 模型 中 ， 候 设 对 每 个 组 织 都 存在 两 个 随机 效应 ， 即 一 个 截 距 和 一 个 
斜 素 。 截 距 Bs 是 在 控制 了 这 些 组 织 中 的 个 人 之 间 在 XX ，…，X。 的 差异 后 的 调 
整 的 平均 数 。 同 样 ， 斜 率 B, 也 是 控制 了 X,，…，X。 的 固定 效应 后 的 结果 。 在 
层 -2， 假 设 Bu 和 局, 随 组 织 特征 W, 而 变化 。 

一 般 说 来 ， 层 - 1 模型 可 以 包括 任何 随机 的 、 非 随机 的 变化 和 国定 的 系 
数 。 在 决定 层 -1 系数 是 理应 作为 随机 效应 时 ， 理 论 上 的 考虑 是 首要 的 。 
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专题 


这 一 章 剩 下 的 部 分 是 一 系列 的 “专题 ”， 涉 及 在 组 织 应 用 中 分 层 模型 的 设 
计 和 使 用 。 有 许多 内 容 是 第 2 版 中 新 增加 的 .我 们 将 说 明 ， 如 何 将 基本 的 多 层 
模型 加 以 推广 ， 应 用 到 层 -上 方差 异 质 性 的 场合 。 接着， 我 们 将 说 明 展 -2 & 
其 的 对 中 选择 将 如 何 影响 层 - 1 随机 系数 B  、 固 定 效应 y AT AG BE p ay Py DE h 
方差 成 分 的 估计 ， 然 后， 我 们 讨论 在 较为 复杂 的 组 织 效应 模型 中 在 解释 方差 比 
例 的 前 述 时 可 能 产生 的 问题 。 接 下 来 ， 我 们 将 描述 如 何 应 用 层 -1 系数 的 经 验 
员 叶 斯 估计 值 作为 具体 组 织 单位 的 绩效 指标 ( performance indicators ) ， 并 讨论 
在 这 些 应 用 中 可 能 产生 的 有 效 性 问题 。 本 章 在 最 后 将 介绍 两 层次 组 织 效应 研究 
在 收集 新 数据 的 设计 中 对 功效 问题 的 考虑 。 


层 -1 方差 异 质 性 情况 下 的 应 用 


在 这 一 章 前 面 所 有 的 应 用 中 , 我们 都 假设 层 - 1 的 残 差 方 差 齐 性 ， 即 
Var(r,) =o", ASP A, RIX BIRR, RRA y 及 其 
标准 误 的 估计 也 是 稳健 的 (Kasim & Raudenbush，1998)。 尽 管 如 此 ， 在 层 -1 
出 现 明 显 措 质 性 的 情况 也 会 发 生 ， 而 且 有 可 能 非常 显著 。 在 这 种 情况 下 ， 分 析 
人 员 就 希望 将 这 种 异 质 性 作为 某 些 测量 变量 的 函数 来 建立 模型 。 这 些 预 测 变 量 
既 可 以 定义 在 层 -1 上 ， 也 可 以 定义 在 层 -2 上 。 

例如 ， 在 第 4 章 中 使 用 的 高 中 及 以 上 (HS&B) 调查 的 学 生 数 学 成 绩 数据 
显示 出 ， 在 层 -1 上 存在 残 差 方差 异 质 性 (检验 层 - 1 方差 异 质 性 的 方法 在 第 
9 章 中 有 介绍 ， 并 用 HS&8B 数据 进行 了 举例 说 明 ) 。 我 们 可 以 假设 这 些 数据 中 
层 -1 的 残 差 方差 在 公立 学 校 和 天 主教 学 校 是 不 同 的 ; 或 者 残 差 方 差 可 能 依赖 
于 某 些 层 -1 的 特征 ， 例 如 性 别 [ 例如 ， 一 些 研究 证 据 表 明 学 习 成 绩 在 男生 之 
间 的 变化 要 比 在 女生 之 间 大 (Hedges & Nowell, 1995) ] 。 

形式 上 ， 由 于 层 -1 方差 oO 被 约束 为 正 值 ， 将 In(o*) 作为 层 -1 和 
层 -2 的 变量 和 和 所 的 线性 两 数 来 建立 模型 要 比 直接 对 o* 建 模 更 合理 ， 因 为 
这 保证 了 与 o 总 为 正 值 的 一 致 性 ， 这样， 我 们 在 基本 的 分 层 线 性 模型 中 又 增 
加 了 一 个 结构 方程 。 
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Into) =a, + ac [5.36] 


其 中 ，C, 可 以 分 别 是 层 -1 或 层 -2 的 预测 变量 1 和 处 。 由 于 方程 5. 36 中 的 
a 系数 将 通过 最 大 似 然 法 估计 ， 在 大 样本 理论 下 ， 这 些 系数 与 其 标准 误 之 比 
Wik: Sith. 如 下 所 述 ， 这 一 检验 统计 量 可 以 用 于 检验 层 -1 异 质 性 来 源 
的 假设 。 


例子 : 对 数学 成 绩 的 层 -1 残 差 方差 的 类 别 效应 建 模 


为 了 举例 说 明 使 用 HS&B 数据 进行 分 层 线性 模型 的 这 一 扩展 应 用 ， 我 们 考 
HB Jet -1 的 残 差 方差 在 天 主教 学 校 和 公立 学 校 之 间 是 否 不 同 。 我 们 建立 一 个 简 
单 的 模型 ， 层 - 1 包括 学 生 的 社会 经 济 状 况 加 ， 以 组 平均 数 对 中 ; 层 -2 以 类 
别 SECTOR 作为 两 类 学 校 的 平均 成 绩 Bw 和 SES 差别 效应 B, 的 预测 变量 ， 即 ; 


Y, = By +B, CX, ~ ¥,) tri 


以 及 Bo, = Yoa + Yo (SECTOR) + uo 
By =¥0 +yu (SECTOR) +u, 


其 中 ，r, 现 在 是 被 假定 服从 正 态 分 布 N(0，o;)。 对 这 个 例子 ， 我 们 规定 : 
In(g;) = ao + a, (SECTOR), 


表 5.9 显示 了 这 一 模型 分 别 在 假定 层 -1 上 存在 和 不 存在 方差 异 质 性 情况 
下 的 估计 结果 。 有 清楚 的 证 据 表 明 ， 在 控制 了 学 生 的 社会 经 济 状况 后 ， 层 -1 
的 残 差 变 化 在 公立 学 校 和 天 主教 学 校 之 间 是 不 同 的 (a = - 0.182, z= 
5.409) 。 将 模型 的 结果 In(o?) 指数 化 ， 我 们 就 可 以 分 别 计算 出 天 主教 学 校 和 
公立 学 校 在 层 -1 的 残 差 方差 估计 。 同 质 性 模型 得 到 的 总 的 层 - 1 残 差 方差 的 
估计 值 为 36. 705。 可 以 看 到 ， 其 实 天 主教 学 校 的 层 -1 残 差 方差 为 33. 31, m 
在 公立 学 校 其 值 要 大 得 多 ， 为 39. 96。 

总 的 来 看 ， 异 质 性 模型 要 比 简单 的 同 质 性 层 -1 模型 能 更 好 地 拟 合 数据 
除了 对 a 的 = 检验 统计 量 高 度 显著 外 ， 用 来 比较 这 两 个 模型 偏差 度 的 似 然 比 
检验 值 Y* =29. 139， 自 由 度 为 1，p <0.000， 也 确认 了 这 一 推断 。 即 使 如 此 ， 
我 们 注意 到 这 两 个 模型 的 y、se(y) 和 了 的 参数 估计 值 仍 非常 接近 。 
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表 5.9 数学 成 绩 的 同 质 性 和 异 质 性 层 -上 方差 模型 的 比较 


(i) FMP ERE NOIR, Varr) =o 


























paisi ani 系数 ee — kë HRE pii 
FEPER 
M BASE). Yo 11. 394 0. 291 39. 166 158 0. 000 
SECTOR. yo, 2. 807 0.436 6.434 158 0.000 
HH: 22 BRR ee 
MHI (BASE). Yi 2 ROI 0. 154 18, 215 158 0. 000 
SECTOR, Yu -1.341 0. 232 -5.777 158 0. 000 
随机 效应 PRAE X: 方差 成 分 AHE af x pifi 
平均 成 绩 . wy 7 G64 8 1383.310 0.000 
SES 255%, uy 0. 489 0.239 158 175, 240 0. 165 
层 -1 效应, 6. 058 36. 705 
WHEN Deviance = 46632. 04 
— ed SA Soh ea — 
Gii) WHEN RRRA, Inf Var( rs)] = an +a, (SECTOR) 
ff eRe Hy 系 数 标准 误 se 1 比率 fick AR df p i 
eee — — Te 
WME (BASE), Yo 11. 393 0. 292 38. 982 158 0. 000 
SECTOR, yo, 2. 807 0. 436 6.441 158 0. 000 
HE de —— 
RIE (BASE), Yio 2.802 0. 160 17. 472 158 0, 000 
SECTOR, Yy -1.341 0. 232 -5.789 158 0. 000 
REBLA Ai RE RRR À hE df x p 值 
FHRA, wy Coo ass ea sg 1392.580 0,000 
SES ËH, uy 6.499 0. 249 158 173. 520 0. 189 
层 -1 方差 模型 
éE x 系 数 标准 误 se : 值 p 值 
CHEE (BASE), a 3.688 “0.024 154. 533 0.000 
SECTOR, a, -0.182 0. 033 ~5. 409 0. 000 
OFA LER, a? = exp[ 3. 688 -0.182(0) ] =39. 96 
对 于 天 主教 学 校 ，o* = expf 3. 688 -0.182(1)) =33.31 
模型 拟 合 优 度 
模 型 SHAT MHA Deviance 
— -1 方 六 8 46632.04 * 
2, * 9 46602. 90 
è HRES piii 
MSGR 6 10.000 a ee 
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B -1 存在 异 质 性 情况 下 的 数据 分 析 建 议 


拟 合 层 -1 残 益 方差 的 潜力 说 明 ， 在 一 些 实质 性 应 用 中 可 以 对 基本 模型 进 
行 扩 展 。 旨 如 第 9 章 中 所 讨论 的 ( 另 见 Raudenbush & Bryk, 1987), J2 -1 方 
差异 质 性 的 存在 可 以 看 作 是 表示 层 -1 模型 设置 错误 的 一 个 综合 指标 ， 即 层 -1! 
异 质 性 的 发 生 要 么 是 由 于 壬 个 重要 的 层 -1 预测 变量 没有 包括 在 模型 中 ， 要 么 
是 某 个 层 -1 预测 变量 被 错误 地 设置 为 固定 效应 ， 而 实际 上 它 应 该 是 被 作为 随 
机 或 非 随 机 变化 的 。 于 是 ， 在 本 例 中 发 现 o 存在 类 别 差 异 ， 建 议 我 们 要 重新 
设置 层 -1 模型 。 什 么 原因 会 导致 两 类 学 校 之 间 残 差 方 差 出 现 差异 昵 ? 有 两 个 
真 接 的 原因 : (1) 天 主教 学 校 和 公立 学 校 中 的 学 生 除了 社会 经 济 状 况 外 可 能 
还 存在 其 他 因素 上 的 差别 ， 有 必要 将 这 些 学 生 层次 的 背景 控制 变量 纳入 模型 ; 
以 及 /或 者 (2) 天 主教 学 校 和 公立 学 校 各 自 内 部 的 学 生 可 能 存在 不 同 的 学 习 
经 历 ， 导 致 这 两 类 学 以 之 间 最 终 的 学 习 成 绩 分 布 不 同 。 例 如 ， 公 立 学 校 的 学 生 
如 果 选 修 的 课程 时 分散， 就 会 导致 更 大 的 异 质 性 (Bryk，Lee,& Holland, 
1993)。 这 一 解释 表明 有 必要 在 模型 中 增加 一 个 学 生 层 次 的 选课 变量 。 这 样 ， 
在 上 述 两 个 方面 对 层 - 1 模型 的 改进 将 使 残 差 异 质 性 减少 。 

简 而 言 之 , 层 -上 异 质 性 的 存在 表明 有 必要 在 这 一 层次 上 对 模型 进行 改 
进 。 模 型 设置 不 当 而 导致 y 和 T 的 估计 产生 偏差 是 可 能 的 。 另 外 ， 对 层 - 10° 
异 质 性 的 设置 有 助 于 提供 这 种 异 质 性 来 源 的 线索 ， 但 它 本 身 不 能 避免 模型 不 当 
产生 的 偏差 。 只 有 将 模型 建立 得 更 精细 才能 有 助 于 解决 这 一 问题 。 


组 织 效应 研究 中 层 -1 自 变 量 的 对 中 


正如 第 2 章 中 所 讨论 的 〈 参 见 “X 变量 的 定位 ") ， 在 两 层 模型 中 , 层 -1 
预测 变量 的 定位 会 影响 到 层 - 1 截 距 的 定义 。 在 某 些 情况 下 对 中 于 某 一 个 常 
ROUX 的 总 平均 数 是 明智 的 ; 而 在 另 一 些 情 况 下 则 应 该 对 中 于 层 - 2 平均 数 
(例如 ,“ 以 组 平均 数 对 中 ") 下面 我 们 考虑 出 于 5 种 推断 目的 而 做 的 不 同 
选择 


。 估计 层 -1 的 固定 系数 
。 分 离 个 人 层次 效应 和 构成 效应 
。 在 调整 层 -1 协 变 基 的 条 件 下 估计 层 -2 效应 
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© 估计 层 -1 系数 的 方差 
o 估计 层 -1 随机 系数 


层 -1 固定 系数 的 估计 


除了 估计 组 织 因 素 对 个 人 层次 因 变 量 的 影响 外 ， 多 层 数 据 还 经 常 被 用 来 估 
计 个 人 层次 效应 。 例 如 ， 在 高 中 及 以 上 调查 数据 中 ， 分 析 的 一 个 主要 问题 是 学 
生 的 社会 经 济 状况 与 数学 成 绩 之 间 的 关系 。 学 生 嵌 套 于 学 校 的 事实 对 层 -1 关 
系 的 恰当 估计 构成 困难 。Burstein (1980) 提供 了 一 个 在 这 种 情况 下 进行 模型 
拟 合 的 有 关 问 题 的 全 面 综述 。 下 面 我 们 简要 讨论 一 下 这 些 问 题 ， 并 说 明 如 何 通 
过 分 层 模型 拟 合 嵌 套 结构 来 解决 这 些 间 题 。 我 们 用 高 中 及 以 上 调查 数据 来 注 示 
这 些 方法 。 现 在 ,我 们 假设 所 感 兴趣 的 层 - 1 的 关系 在 所 有 的 层 -2 单位 上 是 
固定 的 。 


R510 层 -1 回 归 系数 的 不 同 估计 方法 的 比较 














不 同 的 统计 方法 
I2 -1 AY OLS 回归 Mi -2 的 OFS NY 分 层 线性 模型 PARAM 
{没有 分 组 的 分 析 ) CLI Sh BT) (以 组 平均 数 对 中 ) 【以 总 平均 数 对 中 ) 
PBsB A tn, Fmbi +e, Yah eB tt, n Yy Ay Buy Te) er 
isl, e NBA j=l, =, JARIR Bay = Ym + ty Bo; = Yon + to 
Ca AGRE TE Bu = Ye By = 
组 织 ) 
Bı =B, By =By Yu = 有 Ho Titah 
MEARE dE LEEGI 
— Å. 091 9 
se( B,)=0.097 se{ B,) =0.371 se( B,) =0. 109 se( Yu) =0. 106 


a f o 
TE 为 了 在 本 节 中 举例 说 明 ， 我 们 将 SES 系数 设置 为 周 定 效应 。 然 而 ， 第 4 章 中 的 结果 表明 学 以 


他 的 B, 存 在 很 大 的 变化 ”将 ,设置 为 随机 系数 的 模型 的 估计 并 没有 很 大 地 改变 ye 的 估计 (2.193 对 
2.191). 不过， 标准 涡 由 0.109 增加 到 0.125 通过 腿 役 SES 为 -个 层 -1 的 国定 系数 ， 我 们 腿 制 了 Var 
(By) =T =O HE ry RMR yty BD RBI), KERR FO MH ERE WORD 
BEE PELI BR AE R H M f 


首先 我 们 用 分 析 多 层次 数据 最 常用 的 方法 ， 即 用 常规 最 小 二 乘法 在 层 -1 
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上 进行 回归 ， 并 忽略 个 人 嵌 套 于 组 。 表 5. 10 的 第 一 列 是 这 一 分 析 的 模型 和 
数学 成 绩 对 学 生 的 SES 的 回归 结果 。SES 的 回归 系数 估计 值 为 3. 184, 标准 
误 为 0.097 ， 由 于 下 面 将 要 说 明 的 原因 ， 我 们 将 这 一 模型 中 的 回归 系数 标 
H B, 

为 了 比较 ， 表 5. 10 的 第 列 中 显示 了 相应 的 层 -2 或 组 间 分 析 模型 。 当 
得 不 到 个 人 层次 的 数据 时 ， 这 一 回归 系数 B, 经 常 被 当 作 个 人 层次 关系 的 估 
计 值 [ Robinson (1950) Burstein (1980) 及 Aitkin 和 Longford (1986) 讨论 
了 这 种 用 法 的 适用 条 件 ] 。 然而， 在 这 里 的 研究 中 ,Bp, 的 估计 值 5. 909 几乎 
是 语 的 2 僧 。 显 然 ， 这 两 种 分 折 对 个 人 的 社会 经 济 状况 与 数学 成 绩 之 间 的 
类 系 强 弱 的 答案 很 不 一 样 。 还 要 注意 ， 在 这 里 ， 标 准 误 也 很 大 (0.371 对 
0.097) ， 主 要 是 由 于 层 - 2 分 析 中 的 自由 度 为 158， 而 层 - 1 分 析 中 的 自由 
度 为 7183。 即 使 B, 作为 个 人 层次 关系 的 估计 是 恰当 的 (实际 上 在 这 里 并 不 
恰当 ) ， 这 一 估计 一 般 也 比 层 - 1 分 析 估 计 的 精度 差 ， 就 是 因为 单位 平均 数 
的 信息 要 少 于 全 部 个 人 的 数据 。 

人 们 经 常 认为 (例如 ， 见 Firebaugh, 1978) 真正 感 兴 趣 的 个 人 层次 系数 
是 组 织 内 汇 会 的 数学 成 绩 与 学 生 的 SES 之 间 的 关系 。 这 就 是 说 ， 我 们 想 估计 排 
除了 幅 套 的 组 效应 以 后 的 层 - 1 关系 。 通 常 将 这 一 系数 标 为 B.， 可 以 通过 OLS 
求解 下 列 方程 ; 


¥,~¥, = BN, -¥,) +r, [5.37] 


’ 


表 5.10 的 第 三 列 显示 了 与 此 相当 的 分 层 线性 模型 。 对 于 高 中 及 以 上 调查 数据 ， 
有 .为 2. 191， 标 准 误 为 0. 109. 尽管 估计 的 B, 的 标准 误 与 有 的 标准 误 很 接近 
( 一 般 都 是 这 样 )， 但 实际 上 B, WEB, 和 BB, 之 间 。B, 在 形式 上 是 8B, 和 BB, 的 加 
Heit: 

B, = TB, + (1 ~ WDB, [5.38] 


其 中 , n 是 SES 的 学 校 间 误 差 平方 和 与 总 误差 平方 和 之 比 。 

图 5.1 RRT.. p Me 的 关系 。 图 中 是 假想 的 三 个 学 校 的 数据 ， 一 个 
SES 平均 数 很 低 的 学 校 ， 一 个 SES 平均 数 中 等 的 学 校 和 一 个 SES 平均 数 很 高 的 
学 校 。 对 于 每 个 学 校 有 一 条 斜率 为 B. 的 回归 线 ， 描述 该 校 学 生 的 SES 和 了 的 
关系 。 这些 校 内 斜率 被 假设 为 是 相等 的 。 还 有 一 条 回归 线 OHER) 描述 SES 
平均 数 和 Y 平均 数 之 间 的 关系 。 这 是 一 条 只 用 三 个 数据 点 ， 即 各 个 学 校 的 SES 


130 HERRED. 应 用 与 数据 分 析 方 法 

平均 数 和 了 半 均 数 来 估计 的 同 归 线 : 这 条 线 的 斜率 为 B。 最 后 一 条 虚线 是 在 
忽略 校内 学 生 聚 类 的 条 件 下 来 描述 学 生 的 SES 和 “了 之 间 的 关系 : 该 线 的 斜率 有 ， 
ERA IR p. 那么 平坦 ， 也 没有 像 B, 那么 陡峭 . 














— — — — 
-1 0 1 x 
学生 的 村 会 经 济 状 况 (SES) 


图 5.1 组 内 回归 线 (MAA) 斜率 为 Bw ， 组 间 回归 线 (MB) 
斜率 为 B,， 总 回归 线 (虚线 ) HRAL, 


这 样 ， 当 需要 对 个 人 层次 效应 进行 佑 计时 ， 忽 视 数据 的 说 套 结构 将 会 产生 
误导 性 的 结果 。 正 如 Cronbach (1976) 所 注意 到 的 , B, 一 般 是 一 种 无 法 解释 
NBL WB, 的 混合 物 。 在 大 多 数 研究 中 ， 想 要 估计 的 个 人 层次 效应 应 该 是 后 ， 
而 不 是 B,。 

根据 分 层 分 析 来 估计 BL 时 ，X 以 组 平均 数 对 中 至 关 重 要 。 相 反 ， 如 果 数 
据 是 以 总 平均 数 对 中 ， 如 表 5. 9 中 的 第 四 列 ， 那 么 最 终 的 估计 和 值 就 是 8, 和 B, 
的 混合 物 。 在 一 般 情 况 下 ， 权 数 多 Aw, 都 相当 复杂 。 请 注意 ， 高 中 及 以 上 
数据 中 ， 以 总 平均 数 对 中 的 系数 估计 值 为 2. 391。 

这 - -结果 的 取得 是 根据 这 样 一 个 事实 ， 以 总 平均 数 对 中 的 模型 实际 上 包括 
了 太 和 不 .,， 但 分 析 仅 限于 估计 一 个 参数 而 不 是 分 别 估 计 p, 和 JB。( 在 下 一 节 
将 显示 同时 估计 B. ANB, 的 分 层 模型 )。 

重要 的 是 要 注意 ， 在 某 此 情况 下 ， 如 果 B, ALB, 实际 上 是 相等 的 ， 那 么 以 总 
平均 数 对 中 的 模型 将 是 最 有 效 的 ， 在 B, SB. =B 的 假设 下 , i, MB, 是 有 的 独立 
的 无 偏 估计 。 在 平衡 设计 的 情况 下 .这 两 个 OLS 估计 值 的 抽样 方差 分 别 是 : 
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Var 用) = ay DT, - By, 其 中 A = rw toy n 
以 及 
Varep) =/ x x w, -Y 
在 这 一 具体 实例 小 ， 表 5. 10 第 4 列 中 显示 的 有 估计 量 为 
Yu = B= (WB, + WB.) / (W, + W,) [5.39] 


其 中 ; 
W, =[ Var (8.)] "= EK, -KE.) /A 


W, = [Var BO] EEE (4,-¥)°/8 


在 这 一 生体 实例 中 ,7 是 所 MÉ, 的 加 权 平均 数 ， 权 数 是 每 个 估计 值 的 精 
ME. HF B, MB, 都 包含 有 的 信息 ， 那 么 分 层 估计 应 该 使 用 这 一 信息 以 产生 比 
其 任何 之 一 的 精 变 更 大 的 估计 值 。 形 式 上 ， 


[Var(,,)] = W, +W, [5.40) 


即 分 层 估计 的 精度 是 B, 和 有. 二 者 的 精度 之 和 。 有 意思 的 是 ，W, 与 了 近似 成 
EA, W, 与 Jn 近似 成 比例 。 

在 非 平衡 设计 中 ， 公 式 就 变 得 更 加 复杂 。 不 过 原则 是 相同 的 。 假 设 B, =L 
时 ， 以 总 平均 数 对 中 的 分 层 估计 值 将 是 最 有 效 的 。 

当 B, 关 B. 时 ， 如 本 实例 中 的 情况 ， 那 么 以 总 平均 数 对 中 的 分 层 估计 是 个 
人 层次 效应 的 不 恰当 的 估计 。 它 也 是 一 个 无 法 解释 的 混合 物 : 既 不 是 B.， 也 
不 是 B, Mpo FE, MERL, 的 无 偏 估计 时 ， 以 组 平均 数 对 中 就 可 以 做 到 。 
下 面 将 显示 对 A, MA, 同时 进行 估计 的 两 种 分 层 模型 。 


分 离 个 人 层次 效应 和 构成 效应 


构成 或 环境 效应 在 组 织 社会 学 研究 中 一 直 都 是 热点 ( 见 Erbring & Young, 
1979; Firebaugh、1978) 。 在 控制 了 个 人 特征 效应 X, 后 ， 当 把 汇总 的 个 人 层次 
IEA, SAER ,联系 起 来 分 析 时 ， 这 些 效应 就 会 出 现 。 存 层 -1 的 OLS 回 
归 分 析 中 ， 这 些 效应 由 作为 自 变量 而 纳入 模型 的 〈X, —X.) MX RRE: 
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Y, = B, +B(X, -XD + BX, + [5.41] 


构成 效应 是 组 织 层 次 关系 B, 与 个 人 层次 效应 B. 的 差异 程度 。 形 式 上 ， 构 
成 效应 为 : 
B. = B, ~B, =B, -B, [5.42] 


图 5.2 展示 了 这 一 构成 效应 。 我 们 注意 到 B; 的 非 零 估 计 并 不 一 定 是 构成 效应 。 
WR p, ALB, 相等 ， 那 么 就 不 存在 构成 效应 - 

对 构成 效应 的 解释 是 多 种 多 样 的 。 这 种 效应 的 发 生 可 能 是 由 于 与 某 个 组 织 
有 关 的 规范 效应 ， 或 者 是 由 于 ,近似 地 代替 了 模型 中 没有 包括 的 一 些 重要 的 
组 织 变 世 。 它 们 也 可 能 表明 六, ,包含 了 部 分 A POM RRR, KICK KR 
如 何 ， 过 去 的 经 验 研究 表明 ， 构 成 效应 的 发 生 是 有 很 大 的 规律 性 的 【 见 Willms 
(1986) 的 综述 ] 。 

在 分 层 模型 框架 内 ， 这 些 效 应 可 以 通过 两 种 方法 估计 。 在 这 两 种 方法 中 ， 
个 人 层次 X, 包 括 在 层 -1 模型 中 ， 而 它 汇总 的 变量 X. ,包括 在 层 -2 模型 的 截 
距 中 。 这 两 种 方法 的 区 别 ， 如 表 5. 11 中 第 上 和 第 2 列 所 显示 的 ， 在 于 XX 的 对 
中 方法 不 同 。 比 如 第 1 列 ， 是 选择 组 平均 数 对 中 ， XX 和 了, 之 间 的 关系 就 被 直 
接 分 解 为 组 内 和 组 间 成 分 。 具 体 地 说 ，yYo, 就 是 B,，Yio 就 是 B,。 构 成 效应 就 可 
以 通过 简单 的 减法 求 得 。 而 当 疙 ,用 第 2 列 中 的 总 平均 数 对 中 时 ， 则 构成 效应 
就 可 以 直接 估计 ， 而 B, 可 以 通过 简单 的 加 法 求 得 。 





4 0 1 X 
学 生 的 社会 经 济 状况 (SES) 


图 5.2 就 学 于 学 校 : 与 就 学 于 学 校 1 有 不 同情 景 效应 ,的 示意 图 
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表 5.11 个 人 层次 和 构成 【环境 ) 效应 示例 





统计 模型 
以 组 平均 数 对 中 以 总 平均 数 对 中 
¥, = Bo, +By(X,- .+r Yy = By, +B, (X,- Kd +r, 
Bo, = You + Yor ,+ to, Boy = Yon + YorX y + Mo, 
Bu = Yio Bi; = Yw 
Yor = By Yor =P. 
yn =B, Yo =B, 
B. = Yo -Yw By = Yor + Yio 


使 用 “高 中 及 以 上 ”数据 的 估计 








x 数 标准 误 系数 标准 误 w 
各 26 019 和 ”2 的 0. 149 
Jo. =r 5. 866 0, 362 Yor =Be 3. 675 0. 378 
Jw = 有 2.191 0.109 Yo =b. 2.191 0. 109 
B. 3. 675 0.378° És 5. 866 0. 362* 





WE: a 并 不 是 直接 估计 的 . 但 是 可 以 从 y 系数 的 抽样 方差 一 协 方差 矩阵 来 决定 。 


图 5.2 显示 了 所 存在 的 环境 效应 。 与 前 面 一 样 ， 我 们 显示 3 个 学 校 的 结 
果 ， 它 们 相互 之 间 在 平均 SES 上 相差 一 个 单位 。 同 样 ， 对 于 每 个 学 校 ， 图 中 显 
示 了 学 校内 的 关系 8.， 也 显示 了 学 校 之 间 的 关系 B,。pB. 代表 了 同一 学 校 在 
SES 上 相差 一 个 单位 的 两 个 学 生 了 的 期 望 差 异 (这 显示 在 学 校 1 内) 。 相 反 ， 
B, 表示 SES 均值 相差 一 个 单位 的 两 个 学 校 成 绩 均值 的 期 望 差异 (这 显示 在 学 
校 1 对 学 校 2) 。 环 境 效应 B. =B, - B. 是 两 个 学 生 在 因 变 量 上 的 期 望 差 异 ， 这 
两 个 学 生 的 个 人 SES 相等 ， 但 他 们 学 校 的 SES 均值 相差 一 个 单位 。 如 图 5.2 所 
显示 的 ， 环 境 效应 B. 就 是 一 个 学 生 是 在 学 校 2 还 是 学 校 1 上 学 而 使 学 生 增 加 
的 成 绩 。 

在 “高 中 及 以 上 ”数据 中 ， 学 生 层 次 的 效应 为 2. 191 (与 表 5. 10 中 第 3 
列 相等 )， 学 校 层次 的 效应 为 5. 866 ， 两 者 之 差 即 构成 效应 为 3. 675。 上 述 两 种 
方法 得 出 的 结果 是 相同 的 。 显 然 ， 学 校 的 社会 经 济 状况 构成 对 数学 成 绩 有 很 大 
的 影响 ， 甚 至 大 于 学 生 个 人 层次 的 效应 。 
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我 们 应 该 注意 到 .通过 方程 5.41 对 层 -1 的 OLS 回归 可 以 得 到 类 似 的 B, 
B. ALB, 的 点 估计 -一般 而 彰 ，OLS 估计 是 无 偏 的 ， 但 不 如 分 层 线性 模型 的 估 
计 更 有 黎 ( 见 第 3 RE). 而且 B. Me, 的 OLS 标准 误 存在 负 偏差 ， 因 为 方程 
5.41 没有 包括 由 wo 表示 的 学 佼 之 间 的 随机 变化 


ao Fe -1 协 变 量 调整 后 的 层 -2 效应 估计 


HLM 在 组 织 研 究 中 应 用 最 多 的 是 在 控制 一 个 或 多 个 层 ~ 1 协 变量 的 情况 
下 ， 佑 计 一 个 层 -2 的 自 变 最 和 了 的 平均 数 之 间 的 关系 。 一般 假定 (或 通过 经 
验 分 析 确 立 ) 不 存在 构成 效应 。 我 们 在 前 面 举 了 一 个 这 样 的 例子 (参见 “ 写 
作 的 项 目 效果 评估 ") 。 在 这 种 情况 下 ， 以 组 平均 数 对 中 是 不 恰当 的 。 在 以 组 
平均 数 对 中 的 模型 中 、 层 = 的 截 距 是 未 经 调整 的 结果 变量 平均 数 ， 这 里 为 了 
强调 用 几 来 表示 ， 
PEET MEENET [5.43] 
请 注意 ， 当 我 们 对 各 个 学 校 计算 样本 平均 数 时 ， 层 - 1 预测 变量 的 影响 就 消 
失 了 : 


Y =m, +r, [5.44] 
一 个 简单 的 层 -2 模型 代表 了 一 个 层 -2 预测 变量 W, 的 贡献 ; 
H, = Yoo + Yor Wy + um [5.45] 


总 之 在 这 一 分 析 中 ， 要 是 以 组 平均 数 对 中 ，W 的 效应 是 没有 对 三 加 以 调整 的 。 
相反 ， 当 我 们 以 总 平均 数 对 中 时 ， 层 -1 模型 就 变 为 : 


Yy =Ba +B, X-X.. dtr, 
= By +B, (X,-¥ +X, -X r [5.46] 
= Bo, +B (X.,- 8.) +B, A, X) +r 


对 方程 $. 43 和 5. 46 的 比较 发 现 : 
By = a, -Bul Y= Yi) [5.47] 


这 样 ， 在 总 平均 数 对 中 的 模型 中 ， 斜 率 B,, 就 是 平均 数 j 减 去 一 个 调整 值 。 现 
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在 ， 把 这 个 经 过 调整 的 平均 数 作为 结果 变量 我们 在 层 -2 LA: 
Ba =u Bl, Nd = Ya + yorW, + uy [5.48] 


在 方程 5.48 中 ，W, 效应 的 估计 将 根据 不 同 组 织 之 间 层 -1 BOX Fy 
差异 加 以 调整 


估计 层 -1 系数 的 方差 


让 我 们 再 来 看 一 个 只 有 一 个 层 -1 协 变量 站 的 层 - 1 模型 。 这 一 分 析 的 主 
要 的 月 的 是 估计 层 -1 系数 B, 的 方差 r, 。 如果 每 个 组 织 除了 抽样 变化 和 随机 
WREG, WARA A 平均 数 ， 对 中 的 选择 对 r, 的 推断 将 没有 重要 的 影响 - 
在 这 种 情况 下 ， 分 析 者 可 以 选择 的 定位 ， 得 到 最 合理 的 截 距 定义 ， 而 不 需要 
顾虑 对 中 对 层 -1 斜率 的 方差 估计 的 影响 ， 

然而 ， 当 区 的 平均 数 在 不 同学 校 之 间 有 系统 性 的 变化 时 ，ru 的 估计 将 变 
得 相当 复杂 。 在 组 织 研究 中 ， 这 种 变化 常常 存在 ， 这 有 了 两 个 原因 : 第 一 ， 不 同 
组 织 内 的 人 常常 是 选择 或 被 分 配 而 来 的 ， 这 往往 导致 不 同 组 织 在 区 上 的 分 布 有 
一 定 程度 的 分 离 。 例 如 ， 学校 在 一 定 程 度 上 是 根据 学 生 的 社会 经 济 状况 而 分 
的 ; 公司 在 一 定 程度 上 是 根据 员工 的 教育 背景 而 分 的 ; 邻居 在 一 定 程 度 上 是 根 
据 收 入 和 种 族 而 分 的 。 第 二 ， 组 织 可 以 利用 其 构成 来 创造 效应 。 平 均 社会 经 济 
水 平 高 的 学 校 要 比 水 平 低 的 学 校 在 学 生 学 习 上 有 更 积极 的 相互 影响 。 员 工 教 育 
程度 高 的 公司 可 能 比 其 他 公司 更 快 地 引进 新 技术 。 

一 般 说 来 ， 如 果 XY 的 平均 数 在 不 同学 校 之 间 是 系统 性 变化 的 ， 对 中 的 选择 
( 即 对 中 于 组 平均 数 还 是 对 中 于 一 个 常数 ) 对 r 的 估计 将 有 影响 。 在 这 种 情况 
下 .我们 建议 用 组 平均 数 对 中 来 检查 和 估计 斜率 的 异 质 性 。 为 了 建立 这 一 建议 
的 根据 ， 让 我 们 再 来 看 看 高 中 及 以 上 调查 (HS&B) 的 数据 。 

回忆 一 下 我 们 的 美国 高 中 数学 成 绩 分 析 ，MEAN SES 与 截 距 和 SES 与 成 绩 
的 斜率 都 有 关 。 在 这 种 情况 下 ， 让 我 们 来 看 对 中 的 选择 如 何 影响 层 -2 方差 的 
估计 。 我 们 先 看 一 个 无 条 件 的 层 -2 模型 ， 然 后 看 一 个 包括 MEAN SES HM 
型 。 在 每 一 种 情况 下 ,模型 要 么 用 以 组 平均 数 对 中 ， 即 ; 


Lp P) +r, [5.49] 


要 么 用 以 总 平均 数 对 中 ， 即 : 
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无 条 件 模型 ， 基 于 盛 条 件 层 -2 ROW, R512 (第 1 列 ) 显示 了 我 们 所 得 
到 的 方 凑 协 方差 估计 值 ， 截 距 rw 的 方差 在 组 平均 数 对 中 模型 中 为 8.68， 要 比 
总 平均 数 对 中 模型 的 4.83 大 得 多 ”这 种 差别 的 原因 是 组 平均 数 对 中 模型 的 
截 此 是 末 经 调整 的 平均 数 ， 而 总 平均 数 对 中 模型 的 截 诈 是 经 过 调整 的 平均 数 
(参见 前 一 节 )。 不 过 、 我 们 还 注意 到 ，7, 的 估计 值 也 有 明显 差异 ， 在 组 平均 
数 对 中 模型 中 为 0.68， 而 在 总 平均 数 对 中 模型 中 为 0. 42。 为 什么 这 一 斜率 的 
方差 在 不 同 对 中 的 情况 下 会 有 所 不 同 ” 由 于 MEAN SES 和 SECTOR 都 与 截 距 和 
斜率 有 联系 ， 我 们 可 以 认为 在 层 -2 增加 这 些 预 测 变量 将 会 消除 不 同 对 中 情况 
F ru 估计 值 上 的 差别 ， 

条 件 模型 。 以 SECTOR 和 MEAN SES 作为 层 -28, 和 ,的 预测 变量 ， 估 计 
结果 展示 在 表 5. 12 的 第 2 列 中 .请 注意 ， 截 距 方差 rw 的 两 个 估计 值 现 在 基本 
上 收敛 于 2.38 (组 平均 数 对 中 模型 ) 和 2.41 (总 平均 数 对 中 模型 )。 之 所 以 
这 样 ， 是 因为 现在 两 个 模型 都 包括 了 一 个 关于 截 距 的 构成 效应 B.o RM, Ta 
的 估计 值 却 仍 然 有 明显 差异 ， 在 组 平均 数 对 中 模型 中 为 0. 15， 而 在 总 平均 数 
对 中 模型 中 为 0.06， 模 型 在 包括 了 MEAN SES 和 SECTOR 来 预测 斜率 后 ， 仍 
然 发 生 这 种 情况 。 显然， 在 这 一 应 用 中 ， 对 不 的 对 中 选择 会 影响 我 们 对 7, = 
Var(B) 的 估计 结果 。 

对 中 如 何 影响 Th 的 估计 为 理解 以 组 平均 数 和 以 总 平均 数 对 中 如 何 影 
者 对 一 个 随机 系数 的 方差 估计 ， 需要 对 最 大 似 然 (ML) 估计 方法 在 这 种 情况 
下 的 工作 原理 有 所 了 解 . 形式 上 ，EM 运算 (参见 方程 3.76) 的 各 次 迭代 上 的 
新 的 ML 估计 是 两 部 分 的 和 ; 


HACE) 


第 一 部 分 u 是 与 回归 系数 B, 相 联系 的 经 验 贝 叶 斯 ( EB) 残 差 的 平方 。 在 
给 定 的 数据 Y 和 现在 模型 的 参数 估计 值 下 ， 这 个 EB 残 差 也 被 称 作 wu 的 期 
望 值 。 第 二 部 分 岂 , 是 在 给 定 的 数据 Y 和 现在 模型 的 参数 估计 值 下 的 w, 的 
后 验方 差 。 类 似 地 ，7w 的 估计 值 是 截 距 的 经 验 贝 叶 斯 残 差 的 平方 加 上 wy, 
的 后 验方 差 。 这些 公 式 表明 ， 对 斜率 和 截 距 的 方差 估计 直接 取决 于 经 验 贝 
MRE 不过， 以 组 平均 数 对 中 和 以 总 平均 数 对 中 产生 了 这 些 方差 的 不 
la} aE X, 
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表 5.12 对 中 对 层 -1 斜率 方差 估计 的 影响 





Ho 型 
民 -1 pp No 
ht -2 无 条 件 
Bu, = You + Moy 
Bi = Yn +u, 
ht -2 有 和 杀 件 
Bo, = Yoo + Yor (SECTOR), + yo, (MEANSES), + ug, 
Bu = Yio + Yn (SECTOR), + ys (MEANSES), + uy, 
Uo, To To 
a a 
“y Tm Fu 
无 条 件 下 的 结果 有 条 件 下 的 结果 
O amy — a 
a [8.68 0.05 a [238 0.19 
T= T= 
pa cal Ñ 19 0. il 
a° =36.70 a =36.70 
以 总 平均 数 对 中 
. £4.83 =0.15 - 724) 0.19 
‘vous al i433 0.06 
g’ =36. 83 0: =36.74 





这 种 差异 可 以 形象 地 由 图 5. 3 显示， 图 中 是 理想 化 的 HS&B 数据 。 图 中 显 
示 了 了 三 类 党校: 平均 SES 很 低 的 学 校 ， 平均 SES 中 等 的 学 校 和 平均 SES 很 高 
的 学 校 。 在 各 类 学 校 中 ， 成 绩 与 SES 斜率 的 OLS 估计 值 有 所 变化 。 在 以 组 平 
均 数 对 中 的 情况 下 (图 5.3 中 没有 显示 )， 截 距 的 OLS 估计 值 将 会 有 所 收缩 。 
当 估 计 的 截 虹 可靠 性 较 低 时 ， 其 收缩 程度 会 较 大 。 不 过 ， 这 种 收缩 对 斜率 将 没 
有 什么 大 的 影响 ， 除 非 两 者 高 度 相 关 ， 但 HS&B 数据 并 不 是 这 种 情况 。 虽 然 不 
可 靠 的 OLS 斜率 估计 值 一 定 会 收缩 ,但 是 收缩 的 方向 基本 不 会 受 截 距 收缩 的 
影响 。 

相反 ， 总 平均 数 对 中 模型 中 截 距 估计 的 是 调整 平均 数 。 图 5. 3a 启发 性 地 
展 小 了 6 个 学 校 的 调整 平均 数 Bu 的 OLS 估计 。 这 里 关键 的 一 点 是 ， 无 论 对 于 
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平均 SES 很 低 还 是 很 高 的 学 校 ， 经 过 调整 的 平均 数 需要 外 推 〈 由 虚线 表示 ) 

到 这 些 学 校 的 实际 数据 ( 由 实 线 表示 ) 之 外 ， 即 学 校 j 的 调整 平均 数 代表 了 该 

学 校 的 一 个 在 SES 总 平均 数 上 的 孩子 的 期 望 值 。 不 过 ， 如 图 所 示 ， 学 校 1、2、 
(a) 最 小 乘法 WOES) 估计 


Y 








学 生 的 社会 经 济 状况 (SES) 


(b) 经 验 册 叶 斯 (EB) 估计 
Y 


数学 
成 绩 








低 k 商 X 
学 生 的 社会 经 济 状况 (SES) 


图 5.3 以 总 平均 数 对 中 条 件 下 斜率 同 质 化 的 示范 
W: 实 线 代表 各 学 校 收集 的 实际 数据 的 范围 ;虚线 是 基于 拟 合 模型 的 外 推 . 
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5 和 6 中 并 没有 这 样 的 学 生 ”其 结果 ,它们 经 过 调整 的 总 平均 数 要 比 学 校 3 和 4 
更 不 可 靠 《假定 6 个 学 校 的 样本 规模 大 致 相当 )。 于 是 ， 学校 1、2、5 和 6 的 Bu 
的 经 验 贝 叶 斯 估计 将 彰 着 7 的 总 平均 数 收缩 很 多 (请 比较 图 5. 3a 的 OLS 估计 值 
和 图 5.3b 中 Bu 的 EB 估计 )。 凋 整 平均 数 收 缩 的 一 个 主要 后 果 是 斜率 B, 也 必然 
收缩 ， 具 体 地 说 ，OLS 斜率 较为 平坦 和 SES 值 较为 极端 (或 者 很 高 或 者 很 低 ) 
的 学 校 ， 其 经 验 贝 叶 斯 斜率 估计 值 将 明显 增 大 (请 注意 ,例如 在 学 校 1 斜率 估计 
值 寺 的 显著 影响 ) 。 总 体 上 的 结果 就 是 斜率 变化 的 同 质 化 和 对 7,, 的 低估 。 

现在 我 们 将 这 些 思 路 应 用 到 HS&B 数据 中 来 分 析 在 以 总 平均 数 对 中 的 情况 
下 对 估计 7 的 影响 。 在 前 面 我 们 己 经 知道 不 同学 校 的 平均 SES 存在 很 大 差异 ， 
其 结果 ， 上 面 所 说 的 在 以 总 平均 数 对 中 的 情况 下 的 “外 推 问题 ”对 SES 很 低 
和 很 高 的 学 校 都 很 麻烦 ，HS&B 数据 中 还 有 更 多 的 复杂 性 。 在 前 面 我 们 还 知道 
成 绩 与 SES 斜率 的 大 小 取决 于 学 校 的 SES 水 平 。 具 体 地 说 ， 我 们 发 现 SES 水 
平 高 的 学 校 ， 成 绩 与 SES 斜率 较为 陡峭 ; 而 SES 水 平 低 的 学 校 ， 成 绩 与 SES 
斜率 较为 平坦 ( 见 表 4.5)。 基 于 上 面 所 讨论 的 启发 式 的 例子 ， 我 们 期 望 SES 
水 平 低 的 学 校 斜 率 的 经 验 贝 叶 斯 估计 值 在 以 总 平均 数 对 中 的 情况 下 会 大 幅度 地 
朝 正 方向 收缩 而 变 得 更 陡峭 。 而 对 于 SES 水 平 高 的 学 校 ， 由 于 它们 的 OLS $ 
率 本 来 就 较为 陡峭 ， 在 以 总 平均 数 对 中 的 情况 下 ， 和 斜率 的 经 验 贝 叶 斯 估计 值 收 
缩 幅 度 可 能 较 小 ， 即 SES KER H. OLS 斜率 较为 陡峭 的 学 校 ， 其 OLS 调整 的 
平均 数 已 经 朝 着 了 . 向 下 延伸 。 尽 管 对 于 SES 水 平 低 的 学 校 ， 这 些 OLS 调整 的 
平均 数 可 能 同样 不 可 靠 ， 但 由 于 它们 没有 那样 地 偏离 7. ， 在 以 总 平均 数 对 中 
的 情况 下 ， 绝 对 收缩 将 较 小 。 这 正 是 我 们 在 图 5. 4 中 所 看 到 的 。 

图 5.4 中 的 纵 轴 显 示 的 是 以 组 平均 数 对 中 和 以 总 平均 数 对 中 的 EB 斜率 残 
#HZH. BM: 


Y = wig) ~ iw 


而 横 轴 显示 的 是 学 校 的 平均 SES。 正 如 所 预测 的 ， 在 SES 低 的 学 校 ， 经 验 贝 叶 
斯 残 差 在 以 组 平均 数 对 中 的 情况 下 要 比 在 以 总 平均 数 对 中 的 情况 下 更 为 负 向 
(more negative) 。 这 种 情况 的 发 生 是 由 于 以 总 平均 数 对 中 已 经 人 为 地 增 陡 了 这 
些 学 校 的 斜率 ( 见 图 5.3)。 如 果 成 绩 与 SES 斜率 和 学 校 的 SES BH, WAR 
们 可 以 预料 同样 的 现象 会 发 生 在 SES 高 的 学 校 ， 并 会 出 现 总 体 上 的 一 种 曲线 关 
系 ， 即 我 们 可 以 预料 ，SES 高 的 学 校 在 以 组 平均 数 对 中 的 情况 下 要 比 在 以 总 平 
均 数 对 中 的 情况 下 出 现 更 多 的 负 残 差 。 其 实 ， 负 残 差 的 确 已 经 发 生 在 SES 高 的 
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党校， 但 不 像 在 SES 低 的 掌 校 那 么 多 页 已 





EB 估计 的 差 工 : 024 


0.0 
wy (VER ] 
对 中 ) 














减 去 02] 
wy (以 总 平均 数 
对 中 ) -04 
-0.6 Z ? 
-0.8 H — — — —— 
-1.5 -1.0 -0.5 00 05 10 


学 校 的 社会 经 济 状 况 均值 (MEAN SES) 


图 5.4 RAS SES 之 间 的 斜率 Bu 作为 学 校 的 平均 SES 的 函数 时 ， 
以 组 平均 数 对 中 和 以 总 平均 数 对 中 的 经 验 贝 叶 斯 估 记 的 差别 


总 之 ， 基 于 以 总 平均 数 对 中 的 经 验 贝 叶 斯 斜率 估计 值 不 太 可 靠 ， 因 为 它们 
在 计算 每 个 学 校 的 调整 平均 数 时 受到 必须 进行 外 推 的 严重 十 扰 。 经 验 贝 叶 斯 的 
截 距 估计 值 会 朝 着 分 布 的 中 心 显 著 收 缩 。 在 此 过 程 中 ， 回 归 斜 率 被 人 为 地 同 质 
化 ， 最 后 的 结果 是 斜率 变化 的 估计 存在 负 偏差 。 这 种 干扰 在 以 组 平均 数 对 中 的 
情况 下 是 不 会 发 生 的 。 而 且 如 上 所 述 ， 就 是 将 平均 SES 包括 进来 作为 对 Bu 和 
B, 的 一 个 顶 测 变量 也 并 不 能 解决 这 一 问题 。 

我 们 注意 到 ， 以 总 平均 数 对 中 在 组 织 效 应 研究 中 所 带 来 的 这 一 问题 并 非 是 
独特 的 。 在 不 同 单位 的 层 -1 预测 变量 平均 数 存在 差异 和 该 预测 变量 的 斜率 存 
在 显著 变化 的 情况 下 ， 任 何 分 层 模 型 都 有 可 能 产生 这 样 的 问题 。 比 如 在 第 6 
章 ， 我 们 将 考虑 对 中 的 选择 将 如 何 影响 在 历时 环境 中 对 增长 率 方差 的 估计 。 


估计 层 -1 随机 系数 


我 们 在 前 面 一 节 里 已 经 看 到 ， 对 中 如 何 影响 层 - 1 回归 系数 的 方差 估计 。 估 
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计 这 一 方差 时 产生 的 扭曲 源 于 对 截 距 和 斜率 的 经 验 贝 叶 斯 估计 ， 因 而 在 估计 具体 
单位 的 回归 方程 时 ， 同 样 的 问题 显然 是 存在 的 。 于 是 有 下 面 的 结论 : 

1， 如果 对 于 一 个 层 -2 单位， 其 层 -1 的 样本 规模 较 大 ， 那 么 该 单位 回归 
Pa BCH) OLS 和 EB 估计 将 会 重合 . 这 种 重合 不 取决 于 对 在 所 选 的 对 中 方法 。 

2， 当 层 -1 的 样本 规模 较 小 或 中 等 时 ，EB 估计 将 会 比 OLS 估计 有 更 稳定 
且 更 小 的 均 方 误 (mean-squared error) 。 在 这 种 情况 下 ， 存 在 两 种 可 能 性 ， 

a WRX 的 组 平均 数 在 层 -2 单位 之 间 没 有 变化 ， 或 者 它 的 变化 可 以 忽略 
(只 代表 抽样 波动 或 随机 缺失 数据 }， 那 么 以 组 平均 数 对 中 和 以 总 平均 数 对 中 
都 应 该 得 到 类 似 的 结果 ， 尽 管 以 总 平均 数 对 中 会 使 精度 增加 一 点 。 

b. MIR 的 组 平均 数 变 化 很 大 ， 那 么 以 组 平均 数 对 中 将 比 以 总 平均 数 对 
中 得 到 更 稳健 的 单位 别 回归 方程 的 估计 。 


使 用 方差 统计 量 的 削减 比例 


在 本 章 中 ,我 们 详细 论述 了 在 一 个 分 层 线性 模型 中 引进 自 变量 如 何 解释 
层 -1 和 层 ~2 的 方差 ,我 们 还 说 明了 如 何 计算 与 某 种 基准 模型 相 比 的 方差 统 
计量 的 削减 比例 。 总 之 ， 本 章 中 所 介绍 的 两 层 组 织 效应 模型 的 原则 可 以 直接 扩 
展 为 两 层 增长 模型 ( 见 第 6 章 ) 以 及 三 层 模型 ( 见 第 8 章 ) 。 不 过 ， 这 些 技术 
的 使 用 会 产生 混淆 ， 并 随 着 模型 变 得 越 来 越 复杂 而 产生 估计 的 异常 ， 尤 其 是 在 
层 -2 (或 者 在 三 层 模型 的 层 -2 和 层 -3)。 由 于 这 个 原因 ， 下 面 我 们 总 结 一 
下 一 些 重要 的 数据 分 析 建 议 ， 这 些 建议 能 很 好 地 解决 我 们 遇 到 的 多 数 问题 。 

只 有 随机 截 距 的 模型 ， 在 这 些 应 用 中 ， 我 们 要 追踪 两 个 统计 量 : 层 - 1 方 
差 的 削减 比例 和 层 -2 截 距 方差 的 削减 比例 。 层 -1 预测 变量 的 引进 通常 将 减 
少 层 -1 的 残 差 方差 ， 并 也 可 能 改变 层 -2 的 方差 re。 这 种 情况 之 所 以 发 生 ， 
部 分 是 因为 随 着 每 一 个 新 的 层 -上 自 变 量 被 引进 模型 ， 截 距 Bu 的 意义 都 会 发 生 
变化 (回忆 一 下 ,Bw 是 单位 j 的 某 个 层 -1 自 变 重 值 都 为 0 的 个 人 的 预测 结 
RB). 于 是 ，rm 表 示 的 是 对 一 个 不 同 参数 时 的 变化 。 唯 一 的 例外 是 ， 当 所 有 的 
层 -1 预测 变量 是 以 组 平均 数 对 中 时 ，rm 就 是 组 平均 数 这 个 常数 。 从 形式 上 
看 , 层 -1 预测 变量 的 引进 并 不 会 减少 层 - 2 的 方差 .然而 实际 上 ， 层 -2 的 
残 差 方差 既 可 能 大 于 无 条 件 方差 ， 也 可 能 小 于 无 条 件 方差 。 

这 一 观察 产生 了 在 分 层 模 型 层 -2 上 使 用 方差 统计 量 削 减 比例 的 一 个 关键 
原则 ， 从 技术 上 说 ， 一 个 层 -2 参数 比如 Bu 上 的 解释 方差 ， 是 以 层 - 1 模型 设 
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BARE HARE. HER, FR - 2 方差 统计 量 的 削减 比例 只 有 对 同样 的 层 -1 
模型 时 才能 够 说 得 通 。 所 以 ， 我 们 建议 研究 人 员 先 建立 层 - 1 模型 ， 然 后 再 在 
分 析 中 纳入 层 -2 的 预测 变量 。 假 如 层 ~ 1 模型 固定 不 变 ， 在 层 -2 方程 中 对 
Bu 纳入 新 的 预测 变量 ， 计 算 方差 的 削减 比例 不 会 出 现 异 常 。 方 差 的 削减 比例 ， 
或 称 “ 解 释 方差 ”， 将 随 着 显著 的 预测 变 基 纳入 模型 而 增加 。 而 引入 不 显著 的 
预测 变量 对 这 些 “R*” 统 计量 应 该 影响 很 小 或 没有 影响 。 我 们 注意 到 ， 如 果 
一 个 真正 不 显著 的 预测 变量 被 纳 人 方程 ， 残 差 方 差 的 最 大 似 然 估 计 的 细微 增加 
在 数学 上 是 可 能 的 。 这 些 情况 导致 所 计算 的 刚刚 被 纳 人 的 变量 得 到 较 小 负 值 的 
解释 方差 。 然 而 ， 这 些 负 差异 通常 都 相当 小 。 

Snijders 和 Bosker (1999) 提供 了 另 一 种 方法 来 检测 解释 方差 比例 。 这 种 
应 用 于 随机 截 距 模型 的 方法 ， 考 虑 的 是 各 个 层次 上 的 “预测 误差 的 削减 比 
例 "; 即 在 层 -1 上 也 的 预测 误差 的 削减 比例 ， 以 及 在 层 -2 上 7., 的 预测 误差 
的 削减 比例 。 这 一 方法 确保 解释 方差 比例 是 正 的 。 请 注意 ， 解 释 方差 就 是 观察 
到 的 结果 变量 的 变化 { 它 通常 包括 测量 误差 ) 。 

随机 的 斜率 和 截 距 并 型 。 当 层 -2 上 存在 多 项 随机 效应 时 ， 层 -2 上 的 解 
释 方差 可 以 变 得 更 加 复杂 ， 就 像 上 面 所 举 的 成 绩 的 社会 分 布 例子 中 的 以 截 距 和 
斜率 作为 因 变 量 的 模型 。 这 些 复杂 性 的 产生 ， 是 由 于 层 -2 上 的 随机 效应 可 能 
相互 关联 。 其 结果 ， 在 一 个 层 -2 方程 引 人 的 预测 变量 ， 可 能 影响 另 一 个 方程 
中 的 方差 估计 。 

成 绩 的 社会 分 布 的 例子 较为 简单 ， 因 为 所 有 层 - 1 预测 变量 都 是 以 组 平均 
数 对 中 的 ， 并且 所 有 的 系数 也 都 设置 为 随机 的 。 (请 看 下 面 的 讨论 ， 在 一 些 
E -1 预测 变量 是 以 总 平均 数 对 中 的 以 及 /或 者 它们 的 系数 是 固定 的 情况 下 ， 
复杂 性 将 进一步 增加 。) 像 这 样 的 情况 ， 唯 一 可 能 出 现 的 “异常 ”是 ， 在 一 个 
Z -2 方程 中 引入 一 个 预测 变量 似乎 能 够 解释 另 一 个 层 -2 方程 中 的 方差 。 这 
种 情况 的 发 生 是 由 于 这 两 个 方程 的 随机 效应 的 误差 相关 ， 所 以 该 预测 变量 实际 
上 属于 两 个 方程 ， 但 是 在 其 中 一 个 方程 中 没有 和 包括。 例如， 对 于 SES 的 差别 效 
应 引 和 人 一 个 新 的 预测 变量 有 可 能 导致 截 距 项 的 残 差 方差 估计 下 降 ( 即 学 校 平 
均 成 绩 的 变化 ) ， 即 使 它 并 没有 被 纳入 截 距 方程 。 这 一 现象 表明 模型 设置 有 
误 ， 可 以 通过 在 这 两 个 方程 中 都 引入 这 一 预测 变量 来 解决 (第 9 章 中 详细 介绍 
了 一 种 检测 这 种 模型 错误 设置 的 方法 ) 。 我 们 注意 到 ， 在 极端 的 情况 下 ， 一 个 
层 -2 方程 中 的 一 个 预测 变量 本 来 其 有 显著 影响 ， 但 是 当 模 型 中 的 另 一 个 方程 
纠正 了 错误 设置 以 后 ， 这 一 预测 变量 的 影响 会 完全 消失 。 
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这 就 产生 了 另 一 个 在 数据 分 析 中 建立 模型 的 原则 。 尽 管 在 层 -2 模型 中 对 
于 每 个 结果 变量 可 以 纳入 一 组 不 同 的 层 ~2 预测 变量 ,但 这 种 灵活 性 必须 使 用 
得 巧妙 和 谨慎 。 最 安全 的 方法 是 对 于 所 有 层 -2 的 方程 都 引信 人 一 组 共同 的 
层 -2 预测 变节 。 不 率 的 是 ， 照 着 这 一 建议 去 做 并 不 总 是 可 行 的 ， 因 为 可 能 导 
致 估计 过 量 的 固定 效应 参数 。 另 外 ， 在 许多 应 用 中 ， 为 了 比较 模型 的 差别 效 
应 ， 可 能 假设 一 组 不 同 的 变量 去 预测 平均 差异 。 在 这 些 情况 下 ， 我 们 一 般 建议 
首先 设置 截 距 Bu 的 模型 。 如 果 对 于 一 个 或 多 个 斜率 方程 要 考虑 增加 预测 变量 ， 
那么 它们 也 应 该 被 纳 和 人 该 截 距 模型 。 只 有 它们 在 截 距 模型 中 的 确 不 显著 时 ， 才 
能 加 以 删除 。 同 样 ， 当 两 个 或 多 个 随机 斜率 是 中 、 高 度 相 关 ， 要 被 纳入 其 中 一 
个 方程 的 任何 层 -2 预测 变量 也 应 该 被 纳入 另 一 个 方程 。 只 有 其 效应 在 一 个 方 
程 中 的 确 不 显著 时 ， 才 应 该 会 弃 。 

具有 固定 的 和 随机 的 层 -1 系数 以 及 混合 对 中 形式 的 复杂 模型 。 解 释 方差 
出 现 异常 最 有 可 能 发 生 在 一 些 复杂 的 分 层 模型 中 ， 其 原因 并 未 在 所 有 的 情况 下 
被 充分 地 认识 。 除 了 遵循 上 述 提出 的 建议 外 ， 在 一 般 情 况 下 ， 下 面 这 一 做 法 也 
很 有 用 。 对 于 每 个 层 -1 预测 变量 ， 无 论 是 以 组 平均 数 对 中 还 是 以 总 平均 数 对 
中 (或 不 对 中 ) ， 该 层 - 1 预测 变量 的 汇总 指标 万. 也 应 该 被 纳入 截 距 模型 。 这 
使 模型 能 够 代表 每 个 层 - 1 预测 变量 有 可 能 存在 的 、 分 别 的 两 种 关系 B. 和 B,。 
WH B.A, 是 不 同 的 ， 这 在 组 织 应 用 中 是 经 常 碰 到 的 情况 ， 那 么 不 能 包括 这 
两 种 关系 就 意味 着 模型 设置 有 误 。 如 上 所 述 ， 模 型 设置 错误 的 出 现 会 导致 
“解释 方差 ”异常 ， 因 为 存在 层 -2 上 误差 项 的 相关 。 最 安全 的 方法 是 假定 这 
两 个 系数 是 不 同 的 ， 只 有 在 出 现 相反 的 证 据 时 ， 才 对 模型 加 以 限制 。 


估计 个 别 组 织 的 效应 
具体 组 织 的 效应 的 概念 化 


多 层 数据 一 个 很 重要 的 应 用 是 监测 单个 组 织 的 绩效 ， 例 如 公司 、 学 校 或 班 
级 的 业绩 。 我 们 可 以 利用 这 种 数据 使 组 织 领导 得 以 考察 并 对 各 单位 进行 排序 评 
估 ， 或 者 去 发 现 那些 特别 有 效 或 无 效 的 组 织 ， 以 便 深入 研究 。 

下 面 我 们 讨论 在 这 种 情况 下 分 层 模 型 的 使 用 ， 我 们 的 讨论 围绕 着 建立 一 个 
好 的 个 体 学 校 考察 指标 。 不 过 ， 这 里 提出 的 问题 也 适用 于 一 般 情况 。 
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常用 的 学 校 业绩 估计 


对 学 校 业绩 最 常用 的 估计 是 基于 该 校 学 生 的 背景 和 以 前 的 能 力 而 预测 的 平 
均 成 绩 ， 分 值 高 于 预测 值 的 学 校 被 认为 是 效果 好 的 。 每 个 学 校 的 效果 分 值 或 业 
绩 指 标 就 是 其 实际 平均 成 绩 减 去 其 预测 的 平均 成 绩 。 具 体 地 说 ， 如 果 只 有 一 个 
背景 变 址 ， 则 业绩 指标 或 学 校 效应 为 : 


Y-Y. -p(X,-%.) [5.51] 


Hp: 
Y ,是 学 校 / 的 平均 成 绩 ; 
Y.. 是 所 有 学 校 的 总 平均 成 绩 ; 
,是 学 校 的 背景 变量 Y, 的 平均 值 ; 
X.. 是 六 的 总 平均 值 ; 
B 是 调整 系数 


在 方法 论 上 ， 争 论 的 一 个 焦点 是 选择 用 什么 方法 来 估计 B。Aitkin 和 Long- 
ford (1986) 总 结 了 一 些 常 用 的 方法 。 他 们 的 主要 结论 之 一 是 ， 几 OLS 回归 来 
估计 的 B 值 可 能 有 很 大 的 误导 性 (忽略 了 学 生 所 属 的 学 校 ) 。 一 种 替代 的 方法 
是 用 协 方差 分 析 (ANCOVA) 模型 ,将 所 属 学 校 作为 一 系列 虚拟 变量 包括 在 模 
型 内 。 然 而 ， 当 学 校 数 量 增加 时 ， 这 种 方法 就 变 得 不 实用 。 当 每 个 学 校 的 样本 
规模 较 小 时 ，OLS 回归 和 协 方差 分 析 产 生 的 学 校 效 应 估计 值 都 不 稳定 。Rau- 
denbush 和 Willms (1995) 讨论 了 使 用 这 些 指标 对 有 效 推断 的 威胁 。 


经 验 贝 叶 斯 估计 的 使 用 


分 层 线性 模型 估计 的 经 验 贝 叶 斯 歼 差 提供 了 另 一 种 判定 个 别 学 校 业 绩 的 稳 
定 指标 ， 这 些 经 验 员 时 斯 估计 比 以 前 的 方法 有 明显 的 优越 性 : (a) 考虑 了 个 
体 的 组 别 ， 即 使 组 的 数量 很 大 ; 以 及 (b) 当 每 个 学 校 的 样本 规模 适中 时 ， 所 
得 到 的 信 计 值 便 相 当 稳 定 

前 而 讨论 的 随机 蕉 距 模 型 是 这 类 应 用 的 一 种 常用 选择 。 在 学 生 层 次 上 : 


PEF EDN R TE (5.52) 
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在 学 校 层次 上 : 


By, = Yw * Moy [5. 53] 


及 B,=yn. 其 中 y=1, =. 0 [5.54] 


其 中 ，yw 是 总 截 距 。 请 注意 ， 除 了 截 距 外 ， 所 有 层 - 1 回归 系数 都 被 限定 为 在 
不 同学 校 间 固定 不 变 ， 央 而 某 一 学 校 的 效应 就 为 uo。 
组 合 起 来 的 模型 如 下 : 


Y, = yw + Del Nu- ) tug + ry [5.55] 
— 


该 模型 假设 ， 学校/ 的 所 有 学 生 都 有 一 个 效应 us 加 到 他 们 的 期 望 分 值 上 ， 因 为 
他 们 都 在 该 学 校 上 学 。 从 形式 上 ， 它 是 一 个 协 方差 分 析 ， 其 中 的 站 为 协 变量 ， 
J 个 学 校 在 单 因素 随机 效应 协 方差 分 析 中 形成 了 独立 的 组 。 然 而 ， 与 传统 的 随 
机 效应 协 方差 分 析 的 一 个 主要 区 别 是 ， 在 这 里 ， 我 们 的 目的 是 估计 每 个 层 -2 
单位 的 效应 ， 而 不 只 是 它们 的 方差 。 

估计 。 每 个 学 校 / 的 效应 的 OLS 估计 公式 为 : 


tin = Y, -fw - D palT- X) [5.56] 
F 


注意 ， 方 程 5. 56 中 的 ww 只 是 协 方差 分 析 中 的 校 平 均 残 差 。 样 本 m 少 的 学 校 产 
生 的 wu。 估计 值 不 稳定 。 这 些 学 校 更 有 可 能 仅仅 由 于 随机 误差 而 成 为 极端 情况 。 
于 是 ， 选 拌 最 大 的 或 最 小 的 uo 值 表示 最 有 效 或 最 无 效 的 组 织 就 有 可 能 被 随机 
发 生 的 极端 情况 所 误导 。 

如 第 4 章 中 介绍 的 ， 分 层 分 析 中 ww 的 估计 u 是 一 个 经 验 贝 叶 斯 估计 ， 或 
称 收缩 估计 。us 使 学 校 效 应 的 OLS 估计 wo 按 其 不 可 靠 性 成 比例 收缩 。 一 个 学 
校 的 OLS 估计 越 可 靠 ， 发 生 的 收缩 就 越 少 。 因 此 那些 因 不 稳定 而 成 为 极端 的 
估计 值 将 被 拉 向 0 值 。 

具体 地 说 ， 分 层 分 析 中 学 校 效 应 的 估计 值 为 : 


ug = Avie [5.57] 


其 中 ， 


A, = ta) [7e + | 
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它 是 作为 wu 合计 和 值 的 wm 的 可 靠 性 指标 
对 业绩 指标 进行 有 效 推断 所 面临 的 威胁 


尽管 经 验 贝 叶 斯 估计 有 技术 上 的 优势 ， 但 作为 对 业绩 指标 的 估计 仍然 存在 
有 效 性 问题 。 下 面 我 们 讨论 其 中 的 一 些 问题 。 更 详细 的 讨论 请 参见 Raudenbush 
和 Willms (1995) 的 论文 。 

偏差 。 学校 业 绩 指标 的 研究 可 以 看 作 是 半 实 验 性 的 研究 ， 其 中 每 个 学 校 是 
一 个 实验 分 组 。 在 这 种 情况 下 ， 因 果 关 系 推断 的 有 效 性 问题 已 得 到 广泛 的 研究 
(Cook & Campell，1979) 。 当 不 可 能 随机 地 将 个 体 分 配 到 每 个 分 组 时 ， 就 必须 
找到 与 组 别 和 因 变 量 同 时 有 关 的 个 人 背景 特征 ， 并 对 其 加 以 控制 。 这 就 产生 了 
两 个 问题 : 第 一 ， 我 们 没有 把 握 能 找到 所 有 有 关 背 景 变量 并 对 它们 加 以 控制 ; 
第 二 ， 人 们 在 计算 调整 系数 的 合理 模型 上 存在 不 同意 见 ， 而 不 同 的 调整 对 单个 
学 校 效 应 的 推断 会 有 重大 影响 。 不 过 ， 在 考虑 调整 时 有 一 个 总 的 原则 : 一 个 分 
组 在 背景 特征 上 越 是 异常 ， 则 根据 不 同调 整 方法 对 其 进行 的 推断 就 越 敏 感 ， 推 
斯 结果 也 越 不 可 信 。 

这 一 原则 可 以 通过 一 个 虚构 的 夸张 例子 加 以 说 明 。 图 5. 5 中 纵 轴 是 学 生 的 
成 绩 ， 横 轴 是 学 生 的 社会 经 济 状况 (SES) 。 每 个 学 校 都 有 一 条 回归 线 ， 描 述 
社会 经 济 状况 与 成 绩 之 间 的 关系 。 每 条 线 的 长 度 表 示 各 个 学 校 社会 经 济 状 况 的 
取 值 范围 。 请 注意 ， 有 两 组 学 校 : 第 一 组 学 校 学 生 的 SES 较 低 ， 而 第 二 组 学 校 
学 生 的 SES 明显 较 高 。 在 各 组 之 内 ， 从 平行 的 回归 线 之 间 的 较 小 距离 可 以 看 
出 ， 学 校 之 间 的 效果 差别 较 小 。 还 请 注意 ， 存 在 一 个 构成 效应 D， 即 用 学 生成 
绩 对 其 SES 回归 时 ,第 1 组 和 第 2 组 学 校 之 间 的 差别 要 比 我 们 预料 得 大 ， 这 似 
乎 与 学 校 的 平均 SES HX, 

现在 我 们 用 另外 两 个 模型 来 估计 个 别 学 校 的 效应 。 第 一 个 模型 是 固定 效应 
的 协 方差 分 析 ， 控 制 了 学 生 的 社会 经 济 状况 ， 但 忽略 构成 效应 。 形 式 上 是 用 方 
程 5.51 的 模型 : 


Y, = By +B (X,-¥..) #4, [5.58] 
其 中 ，B 是 与 学 生 的 SES 有 关 的 调整 系数 ，Bo 为 固定 的 学 校 效 应 。 由 于 在 6 
个 学 校 之 间 ， 成 绩 与 SES 的 关系 是 相同 的 ， 任 何 两 个 学 校 效应 的 差别 就 是 它们 
回归 线 之 间 的 距离 。 例 如 、 学 校 2 与 学 校 5 之 间 差 别 很 大 。 注 意 ， 在 这 个 模型 
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中 , 第 2 组 中 的 任何 一 个 学 校 都 要 比 第 1 组 中 的 任何 一 个 学 校 更 有 效 。 


2 学 校 4 


组 
— — 学 校 5 
成 绩 — 学 校 6 





社会 阶层 


图 5.5 两 组 学 校内 成 绩 与 学 生 的 社会 经 济 状况 之 间 关 系 的 虚构 例子 : 
组 1 社会 阶层 较 低 ， 组 2 社会 阶层 较 高 


第 二 个 模型 在 估计 学 校 效 应 时 对 学 校 的 SES 水 平 加 以 控制 。 这 要 将 方程 
5.58 扩展 ， 加 入 学 校 的 平均 SES KEN EAP TEM. Hn: 


Y, = By +B Xy- X) ABX- X) +7, [5.59] 


实际 上 ， 方 程 5. 59 意味 着 相同 境况 的 人 之 间 的 比较 。 现 在 ， 将 第 一 组 的 学 校 
相互 比较 ， 将 第 二 组 的 学 校 相 互 比较 。 从 图 5. 5 看 出 ， 现 在 学 校 2 和 学 校 5 被 
看 作 是 同样 有 效 的 : 它们 各 自 都 是 该 组 内 (具有 相似 社会 构成 的 学 校 ) 的 平 
均 水 平 。 

这 一 方法 好 像 比 前 一 种 方法 更 合理 ， 但 真 的 是 这 样 吗 ?假设 第 2 组 学 校 拥 
有 更 有 效 的 教师 ， 并 且 是 教师 素质 高 而 不 是 学 生 构 成 导致 了 较 高 的 考试 成 绩 。 
比如 ， 如 果 学 校 所 在 的 区 将 最 好 的 校长 和 教师 分 配 到 较 富裕 的 学 校 中 ， 那 么 图 
5.5 中 的 结果 就 会 发 生 。 如 果真 的 是 这 样 ， 第 二 种 方法 的 结果 也 不 会 对 这 些 工 
作 更 有 效 的 领导 给 予 荣 誉 。 

关键 的 问题 是 ， 在 模型 中 没有 明确 加 入 一 个 代表 学 校 质量 的 变量 时 ， 我 们 
永远 不 可 能 将 学 校 构 成 效应 与 其 他 和 构成 相关 的 学 校 效 应 相 分 离 。 

回归 的 异 质 性 。 尽管 存 在 问题 ， 但 上 面 的 例子 仍 比 实际 情况 简单 得 多 。 我 
们 的 例子 假设 SES 与 成 绩 的 回归 线 在 所 有 学 校 是 相同 的 。 但 在 许多 情况 下 ， 回 
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让 是 异 质 性 的 ， 如 图 5.6 所 钞 。 现 在 ， 无 论 采 取 何 种 调整 方法 ， 学 校 效果 的 估 
计 将 依赖 于 学 生 的 社会 经 济 状 况 ， 例 如 ， 对 于 低 SES 的 学 生来 说 ， 学 校 1 相 比 
于 学 校 2 是 非常 有 效 的 〈 即 图 5.6 中 的 效应 1)， 然 而 ， 对 于 高 SES 的 学 生来 
说 ， 两 个 学 校 之 间 的 差异 很 小 《 即 效应 2) 








低 社会 阶层 的 学 生 高 社会 阶层 的 学 生 


图 5.6 在 成 绩 与 学 生 背 景 之 间 的 关系 存在 异 质 性 时 
对 学 校 效应 的 识别 


自我 实现 的 收缩 。 如 第 3 章 所 讨论 的 ， 收 缩 估 计 us 的 期 望 均 方 误 要 比 最 
小 二 乘 估计 wo 的 小 ， 并 能 避免 我 们 的 推论 受 随机 波动 的 干扰 。 然 而 收缩 估 
计 是 有 条 件 偏 差 的 。 从 方程 5.56 看 出 ， 在 给 定 uo 真 值 的 条 件 下 ， 其 期 望 值 
Wo 为 : 





E (ig uy) = Uy = py, = eee =o ae) [5.60] 
7 


其 中 ,Ar 是 第 /组 未 调整 的 因 变 量 平均 数 。 请 注意 ，vww 是 第 /组 未 调整 的 平均 
数 上 与 根据 学 生 背景 变 生 的 预测 值 之 间 的 离 差 。 经 验 贝 叶 斯 估计 us 的 条 件 期 
望 值 为 ; 


E( tg uo,) = À jitg {5.61} 
y Moy jito 
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Hut, W (bias) 就 是 : 
bian( ue luy) =- (1 -a [m - Eye, -7 ] [5.62] 


这 一 公式 表明 ， 按 照 09 AST RE uo 估计 值 将 朝 着 根据 学 生 背 景 的 预测 
值 方向 偏 过 去 。 例 如 ， 那 些 员 然 学 生 背 景 不 利 但 却 非常 有 效 的 学 校 ， 它 们 较 高 
的 半 均 效应 估计 将 会 向 下 朝 着 其 他 学 校 的 一 般 值 偏 过 去 ， 那 些 不 利 学 校 的 情况 
也 与 之 类 似 。 这 样 ， 这 种 方法 就 形成 了 一 种 统计 上 的 自我 实现 能 力 ， 即 在 数据 
不 可 靠 的 条 件 下 ， 学 校 效应 会 偏离 实际 情况 ， 趋 向 于 期 望 值 。 


设计 两 层 组 织 效应 研究 时 对 功效 的 考虑 


在 设计 两 层 组 织 效应 研究 中 ， 关 键 的 考虑 是 每 个 组 织 内 的 样本 规模 n 以 及 
组 织 的 个 数 /的 选择 。 对 n 和 J 的 最 优选 择 主要 取决 于 研究 目的 。 我 们 简单 地 
考虑 三 种 情况 : 主要 关注 的 解释 变量 在 层 -2; 主要 关注 的 解释 变量 在 层 -1; 
主要 关注 点 是 路 层 的 交互 效应 ( 即 层 - 2 的 预测 变量 对 层 ~ 1 的 斜率 系数 的 
影响 ) 。 

主要 解释 变量 在 层 -2， 每 个 组 织 适当 的 n 取决 于 各 层 抽样 单位 的 成 本 和 
各 层 上 的 变化 。 当 (a) 对 组 织 进行 抽样 成 本 较 高 时 (相对 于 选中 一 个 组 织 后 
对 其 组 织 成 员 的 抽样 而 言 ) 和 (b) 组 织 内 的 变化 较 大 (Raudenbush, 1997; 
Snijders & Bosker, 1999) 时 ， 定 一 个 大 规模 的 n 是 有 用 的 。 在 只 有 一 个 层 -1 
解释 变量 和 一 个 层 -2 解释 变量 的 简单 的 平衡 设计 的 情况 下 ， 抽 样 研究 的 一 个 
著名 的 结果 (参见 Cochren，1975) 是 ， 每 一 群 的 最 优 规模 m 为; 


na = fence — [5.63] 

其 中 ，C,/C, 是 层 -2 和 层 -1 的 抽样 成 本 之 比 , p =rm/ (Tatr) 是 组 织 内 

的 相关 。Raudenbush (1997) 讨论 了 在 层 - ! 增加 协 变量 如 何 通 过 减少 rw 和 
oF 来 增加 功效 。 

主要 解释 变量 在 层 -1， 当 主要 的 解释 变量 在 层 - 1， 我 们 的 关注 就 可 能 是 

层 -1 变量 的 平均 效应 ， 即 ye。 例 如 ， 假 设 层 -1 变量 是 一 个 实验 处 理 标识 

(实验 组 X; =1， 控 制 组 为 0) 并且 在 任何 层次 上 都 没有 其 他 预测 变量 ， 那 么 
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每 个 组 织 中 最 优 的 n 为 ; 


ny = Ve ne Th >0 [5.64] 

其 中 ，r, 是 层 -1 BRM, o 是 层 -1 或 “和 群 内 ”的 方差 。 我 们 注意 到 ， 
如 果 主 要 上 日 的 是 要 精确 地 估计 7,, ， 那 么 所 需要 的 n 通常 要 大 于 mw (Rauden- 
bush & Liu, 2000), 

足 层 的 交互 效应 假设 我 们 的 目的 是 要 推断 一 个 跨 层 的 交互 效应 ， 例 如 ， 
层 -2 的 实验 处 理 标 识 下 对 与 层 -1 预测 变 重 X, 相连 的 单位 内 斜率 有 影响 。 假 
定 ru >0 (ru 是 在 控制 W 后 的 层 -1 斜率 的 残 差 方差 ) ， 就 可 以 应 用 方程 
5.64, 然而， 如果 ri =0， 则 精度 将 取决 于 总 样本 规模 nj。 

Raudenbush 和 Liu 开发 了 一 个 基于 Windows 的 计算 程序 ， 用 于 为 不 同 组 织 
效应 和 增长 研究 计算 最 优 样本 设计 和 功效 ， 该 程序 可 以 从 www. ssicentral. com 
得 到 。 


O 
个 体 变 化 研究 中 的 应 用 


e 个 体 变化 研究 中 的 背景 问题 

. 建立 模型 

. 线性 增长 模型 

© 二 次 增长 模型 

8 其 他 形式 的 增长 模型 

e 个 体 变化 研究 中 层 -1 自 变量 的 对 中 

o 比较 分 层 模 型 、 多 元 重复 测量 模型 和 结构 方程 模型 
© 层 -1 PRAM MH BA 

。 利用 分 层 模型 来 预测 未 来 状况 

e 增长 与 变化 的 研究 设计 中 有 关 功 效 的 考虑 


个 体 变 化 研究 中 的 背景 问题 


在 个 体 变化 的 研究 中 ,行为 科学 研究 者 一 直 缺 乏 有 效 的 方法 。Harris 
(1963) 所 总 结 的 许多 相关 问题 仍然 困扰 着 个 人 成 长 的 定性 研究 。 这 些 方法 论 
上 的 问题 ， 导 致 了 研究 设计 与 分 析 中 的 两 难 现象 ; 一 方面 是 出 于 好 的 愿望 ， 另 
一 -方面 则 是 错误 地 引导 了 研究 方向 。 然 而 ，Rogosa 、Brand 和 Zimowski (1982), 
Rogosa 和 Willett (1985) 与 Willett (1988) 已 解决 了 其 中 的 许多 错误 概念 。 
Raudenbush (2001) 对 这 些 问 题 及 最 新 的 发 展 作 了 回顾 。 

简 而 言 之 ， 对 变化 的 研究 受到 概念 化 、 测 量 及 设计 等 方面 不 足 的 影响 。 概 
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念 方面 的 考虑 是 : 需要 一 个 模型 来 指导 对 研究 现象 进行 更 加 深入 的 考察 。 然 
而 ， 个 体 变化 的 研究 -- 直 都 不 能 确定 一 个 关于 个 人 成 长 的 明确 模型 。 在 测量 问 
题 上， 个 体 变化 研究 经 常 使 用 的 是 在 固定 时 点 上 对 个 体 差 别 进行 区 分 的 工具 ， 
这 种 测 世 很 少 考虑 个 体 之 间 变 化 率 莽 异 的 适当 性 。 此 外 ， 在 实际 应 用 这 种 测 其 
上 有 具 时 ， 规 定 所 有 时 点 上 都 具有 相同 方差 是 研究 变化 及 其 决定 因素 的 致命 问题 
(Rogosa et al. , 1982). 最 后 ,或许 也 是 最 重要 的 ， 就 是 研究 设计 问题。 许多 
变化 研究 仅仅 收集 两 个 时 点 上 的 数据 。 这 种 研究 设计 对 于 个 体 成 长 过 程 研 究 来 
说 是 不 够 的 (Bryk & Weisberg, 1977; Rogosa et al. ，1982; Bryk & Rauden- 
bush, 1987). DIRI E OS 6 HC AS Te] BR AE 2 HR oy Se it AE ( Rauden- 
bush & Liu, 2001). 

分 层 线性 模型 的 发 展 为 个 体 变 化 的 研究 提供 了 一 个 强大 的 方法 体系 。 在 应 
用 多 个 时 点 上 的 有 效 测量 时 ， 这 些 模型 将 为 研究 个 体 成 绩 增 长 的 结构 及 其 预测 
变 基 提供 一 体 化 的 方法 

正如 第 5 章 ， 本 章 在 第 2 版 中 有 了 很 大 的 扩展 . 新 增加 了 一 节 ， 专 门 阐述 
层 -1 自 变量 对 中 的 作出 。 比 较 分 层 模型 与 多 元 重复 测量 (multivariate repeated- 
measures) 和 结构 方程 模型 structural equation models) 的 一 节 也 有 很 大 修订 ， 
并 包括 了 对 第 1 版 以 来 在 这 方面 的 主要 发 展 的 讨论 。 我 们 还 示范 了 层 ~1 中 的 异 
质 性 误差 现在 是 如 何 被 结合 到 分 层 增长 模型 中 的 ， 并 且 考 虑 了 层 -1 缺失 的 时 
间 序 列 观 察 值 对 推论 的 影响 。 本 章 的 最 后 一 节 也 是 本 版 新 增加 的 内 容 ， 它 讨论 
了 增长 曲线 研究 设计 中 的 功效 问题 


建立 模型 


许多 个 体 变化 现象 可 以 通过 一 个 两 层 分 层 模型 来 代表 。 在 层 -1 中 ， 每 个 
人 的 发 展 可 以 用 一 套 独 特 的 参数 所 决定 的 个 体 增长 轨迹 来 表达 。 这 些 个 人 的 增 
长 参数 是 层 -2 模型 中 的 结果 变量 ， 它 依赖 于 一 些 个 人 层次 的 特征 。 就 形式 而 
言 ， 我 们 将 对 每 一 个 人 的 多 次 观察 视 为 嵌 套 于 这 个 人 。 在 观察 时 点 的 数量 与 间 
了 天 在 个 人 之 间 变 化 时 ， 这 种 将 多 次 观察 视 为 幅 套 的 方法 使 得 研究 工作 得 以 毫 无 
困难 地 进行 。 

我 们 先 介绍 本 章 用 到 的 一 种 新 标注 ， 用 来 表示 两 层 分 层 模型 。 层 - 1 系数 
现在 用 mw 来 表示 ， 层 -2 系数 则 用 B 来 表示 。 层 -1 和 层 -2 的 自 变量 分 别 标 
注 为 a。 和 XX,,， 两 层 中 的 随机 效应 则 分 别 用 e, 和 心 来 表示 。 这 种 新 的 标注 有 利 
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于 我 们 在 第 8 章 中 的 介绍 ， 它 将 个 人 成 长 研究 与 组 织 效应 研究 结合 在 一 个 二 层 
的 模型 中 


重复 观察 模型 ( 层 一 1) 


假定 7 是 一 个 系统 的 增长 轨迹 或 者 成 长 曲线 加 上 随机 误差 的 函数 。 其 中 ， 
是 个 体 i 在 时 间 ! 上 所 观察 到 的 状态 。 如 果 系 统 的 增长 随时 间 变 化 可 以 表达 
为 性 阶 多 项 式 的 话 ， 就 比较 方便 了 。 这 时 层 -1 模型 可 以 表示 为 


VY, = my, + Ta, + Mya, + + yal +e, [6.1] 


HP, i=l, e, a SPRAIN TA, 0, RB i AAEN ob aE, 
而 mx* 则 是 对 应 于 个 人 ;的 增长 曲线 的 参数 p， 它 与 多 项 式 的 阶 数 AKR (E 
PaO ry P) 每 个 人 被 观察 的 时 点 为 卫 。 注意 ,测量 的 次 数 和 间隔 在 每 个 
人 之 问 可 以 是 不 同 的 

通常 情况 下 总 是 假设 ,有 一 个 篇 单 的 误差 结构 ， 也 就 是 说 ， 每 一 误差 6, 是 
独立 的 ， 服 从 平均 值 为 0 和 方差 为 常数 o 的 正 态 分 布 。 然 而 ， 这 种 误差 结构 
可 以 采用 多 种 更 复杂 的 形式 ， 这 将 在 本 章 的 后 面部 分 予以 讨论 。 在 考虑 更 复杂 
的 假定 之 前 ， 我 们 首先 考虑 有 固定 方差 的 层 - 1 独立 误差 的 情况 。 


个 人 层次 模型 ( 层 一 2) 


方程 6. 1 的 一 个 重要 特征 就 是 ， 假 设 个 体 之 间 的 增长 参数 是 不 同 的 。 因 此 
我 们 构造 了 层 - 2 模型 来 表示 这 种 变化 。 具 体 来 说 ， 对 P+1 个 个 体 增长 参数 
中 的 每 一 个 有 : 


Op 
Ta = Ba + YB,X, +1, [6.2] 


其 中 : 
和 ,或 是 测量 的 个 人 背景 特征 ( 如 性 别 或 社会 阶层 ) ， 或 是 实验 分 组 (如 课 
程 类 型 或 教学 基 ); 
i KIR, HI 4 对 中 以 减少 a,、 避 和 as 之 间 的 共 线 性 是 非常 重要 的 。 对 于 高 阶 多 项 式 ， 
正 交 变 换 是 非常 有 帮助 的 ， 莫 至 是 基本 的 〈 见 Kirk , 1982, 第 151 ~154 页 ) 。 
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Bu RAS X 对 第 p 个 增长 参数 的 效应 ; 

是 平均 值 为 0 的 随机 效应 。 假 定 对 第 i 个 人 的 -一 系列 P+1 个 随机 效应 
服从 多 元 正 态 分 布 ， 有 满 秩 的 LP +1) x(P+1) 阶 的 协 方差 矩阵 T。 

我 们 假定 在 本 章 所 讨论 的 所 有 应 用 研究 的 随机 效应 都 服从 于 这 种 多 无 正 态 
分 布 


线性 增长 模型 


在 许多 情况 下 ， 特 别 是 当 对 每 个 人 的 观察 数量 都 比较 少时 〈 如 仅 有 二 四 
次 ) ， 利 用 方程 6. 1 的 线性 个 人 增长 模型 是 比较 方 使 的 。 当 时 间 段 较 短 时 ， 更 
复杂 的 过 程 由 于 极 少 的 观测 值 而 无 法 完全 拟 合 ， 这 个 模型 可 以 为 一 些 复杂 过 程 
提供 一 个 较 好 的 近似 。 

层 -1 为 线性 模型 时 ， 方 程 6. 1 简化 为 : 


Ya = To ETa, +e, [6.3] 


其 中 ,我 们 假定 误差 项 "是 独立 的 ， 而 且 服 从 于 方差 为 相同 o 的 正 态 分 布 。 
这 里 ，mry 是 第 工 个 人 在 数据 收集 过 程 中 的 增长 率 ， 表 示 固 定单 位 时 间 中 的 
期 望 变化 。 截 距 参数 rw 是 第 让 个 人 在 a, =0 时 的 真实 能 力 。 因 此 ，mrw 的 具体 
意义 就 有 赖 于 年 龄 的 计 基 单位 。 
截 距 和 增长 率 参 数 都 被 允许 在 层 -2 中 作为 个 人 特征 测量 的 函数 而 变化 ， 
因此 ,方程 6. 2 就 可 以 转换 成 : 
To = Boo + Ea + Fo, 
i (6.4) 
Tu = By + Rbt +r, 


注意 ， 这 里 有 两 个 层 -2 的 随机 效应 由 和 mm ， 它 们 的 方差 分 别 为 re 和 ru ， 协 
方差 为 Tao 

在 这 一 节 中 ,我 们 示范 线性 个 人 增长 模型 如 何 应 用 到 以 下 几 个 方面 : 
(a) 估计 一 个 平均 增长 曲线 以 及 个 体 在 其 周围 的 变化 范围 ; (b) 在 研究 状态 
和 变化 时 评价 测量 的 可 靠 性 ; Ce) 估计 初始 状况 和 变化 率 之 间 的 相关 ; 
(d) 个 体 层次 的 自 变量 与 状态 、 变 化 之 间 的 模型 关系 。 
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例子 : 教导 对 认 知 增长 过 程 的 作用 


本 例 的 数据 来 自 “ 早 期 发 育 项 目 ” 中 所 涉及 的 143 个 儿童 的 自然 科学 知 
识 的 测试 结果 - 整个 研究 是 为 了 建立 学 龄 前 和 低 年 级 儿童 的 成 长 测量 ( 而 不 
仅 仪 是 现状 ) ， 所 用 数据 是 整个 研究 的 一 部 分 调查 内 容 。 这 种 测量 产生 于 一 系 
列 基 于 分 项 反应 理论 测量 的 项 目测 验 分 数 ， 并 用 “logit 单位 ”来 表示 。 这 种 
单位 指 一 个 人 应 对 不 同 难度 问题 的 能 力 ， 即 回答 正确 的 对 数 发 生 比 。 

最 初 的 设计 要 求 对 每 个 儿童 的 测试 是 一 年 四 次 ， 并 且 间 隔 近 似 相 等 。 实 际 
上 ,各 儿童 的 测试 日 期 有 所 变化 ， 而 且 也 并 不 是 每 个 儿童 每 次 都 参加 了 测试 。 
年 龄 变量 a 以 月 为 单位 ,定义 为 自 初次 数据 收集 时 点 后 所 度 过 的 月 份 。 在 这 
种 设置 下 ,方程 6.3 中 的 rw 代表 在 数据 收集 开始 时 第 让 个 人 的 真实 能 力 水 平 ， 
也 可 以 称 之 为 初始 状况 。 除 了 测试 数据 以 外 ， 还 收集 了 学 生 的 其 他 信息 ,包括 
疆 语 〈 如 西班牙 语 或 英语 ) ， 以 及 直接 教导 的 数量 (平均 每 学 年 的 课时 ) 。 


随机 系数 回归 模型 
方程 6.3 设置 了 层 - 1 模型 。 在 层 -2， 我 们 先 建立 一 个 最 简单 的 个 人 层 


次 模型 : 


Ta = Bo + ro [6.5] 


ny = Bo +h, 

我 们 注意 到 ， 方 程 6. 5 是 一 个 无 条 件 模型 ， 其 中 对 rw 和 i, 没有 设置 以 上 所 提 
到 的 层 -2 自 变量 。 在 上 一 章 所 讨论 的 组 织 研究 应 用 中 ， 分 层 分 析 通 常 也 是 从 
拟 合 无 条 件 模型 开始 。 这 个 模型 为 确定 一 个 适当 的 个 人 增长 方程 提供 了 非常 有 
用 的 经 验证 据 ， 而 且 为 评价 以 后 的 层 -2 模型 提供 了 参照 统计 。 表 6. 1 中 列 出 
了 这 个 分 析 的 结果 。 

平均 增长 轨迹 。 对 于 自然 科学 的 数据 来 说 ， 估 计 的 平均 截 距 名, 和 平均 增 
长 率 Bu。 分别 为 -0. 135 和 0. 182。 这 就 表明 ， 在 最 初 测试 中 平均 的 自然 科学 得 
分 为 -0. 135 个 logit 单位 ， 以 后 儿童 在 学 习 期 间 以 平均 每 个 月 0. 182 个 logit 单 
位 的 速度 增长 。 

正如 在 第 3 章 中 所 讨论 的 ， 对 于 固定 效应 (现在 用 B 来 表示 ) 的 假设 检 
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验 采 用 估计 效应 与 其 标准 差 的 比率 作为 检验 值 : 不 论 是 截 距 还 是 增长 率 ， 只 要 
有 上 检验 值 足 够 大 ， 就 表明 这 了 两 个 参数 在 描述 平均 增长 轨迹 时 是 必要 的 。 


R61 自然 科学 知识 增长 的 线性 模型 {无条件 模型 ) 











aL Re Hig 系数 祭 礁 误 se 1 比率 
平均 初始 状况 , po -0.135 0.005 27.00 a 
平均 增长 率 ， Bio 0, 182 0. 025 7.27 
随机 效应 Jy HE Sh th PIE df x piti 
WRM, ro e T 
MKE, n, 0.041 139 724.91 <0.001 
ii -1 MR, eu 0.419 





W BERU RR BT AA D AS i APE 


“AMAR, a, 0. 854 
MKE. m; 0.799 





增长 轨迹 的 个 人 差异 下面， 我 们 将 考察 个 人 增长 轨迹 与 平均 曲线 之 间 离 
差 的 性 质 。 个 人 增长 参数 ru 和 zr,, 的 方差 估计 值 分 别 为 1.689 和 0.041, E4 
第 3 章 所 装 论 的 ， 最 简单 的 同 质 忻 检验 ， 即 在 个 人 之 间 增 长 参数 没有 真实 差 
异 ， 使 用 x 统计 值 。 利 用 方程 3. 103 可 以 得 到 截 距 的 检验 统计 值 356. 90 (df = 
139, p<0.001)。 这 就 可 以 使 我 们 拒绝 虚无 假设 ， 并 且 认 为 儿童 的 自然 科学 知识 . 
在 刚 进入 这 个 “早期 发 育 项 目 ” 时 就 存在 显著 性 差异 。 相 应 于 统计 假设 : 每 个 
儿童 的 增长 率 没 有 个 体 差异 ， 即 Hu: ri =0 hy 统计 值 为 724.91 (df =139, p< 
0.001) 。 这 可 以 让 我 们 得 出 结论 ， 认 为 他 们 的 学 习 增 长 率 存在 显著 的 差异 。 

方差 估计 值 7,, =0.041 意 指 估计 的 标准 差 为 0. 202。 因 此 ， 对 于 某 个 儿童 
而 言 ， 如 果 他 的 增长 率 在 平均 值 的 一 个 标准 差 以 上 ， 可 望 他 将 以 每 个 月 
0. 182 +0. 202 =0. 384 个 logit 单位 的 速度 增长 。 

初始 状况 及 变化 的 可 靠 性 。 对 无 条 件 模型 的 估计 还 允许 我 们 考察 个 人 增长 
参数 估计 的 心理 计量 特征 。 如 果 一 个 人 增长 参数 rw 的 OLS 估计 值 宙 ,中 的 变异 
性 大 部 分 归 因 于 模型 的 误差 ， 那 么 我 们 就 不 可 能 发 现 这 些 估计 值 与 个 人 层次 变 
其 间 的 任何 系统 关系 。 如 果 不 知道 增长 参数 估计 的 可 靠 性 的 话 ， 我 们 或 许 会 错 
误 地 认为 它们 之 间 没 有 任何 关系 ， 而 事实 却 是 这 一 数据 还 没有 能 力 探测 这 种 
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关系 
问 想 方程 3. 28, 层 -1 系数 的 OLS 估计 的 总 变异 包括 了 误差 方差 和 参数 方 


差 . 按照 本 章 的 标注 方法 ， 有 : 


Var(a,,) = Varla | mu) + Vara) = 0 + Tp [6.6] 


根据 经 典 的 测量 理论 ，“ 真 实 的 ”参数 方差 Var(7,,) 5 “AT” WITT 
Var( 7 ) 之 比 ， 是 OLS 估计 ,的 可 靠 性 ， 其 中 rw 作为 “真实 的 ”增长 参数 
mr 的 测量 值 。 类 似 于 方程 3. 58， 对 于 任何 个 人 i 的 p=0，…，P 个 增长 参数 
估计 值 的 可 靠 性 为 :* 


reliability(#,.) = Var(a,,)/Var(a,,) = 7,,/(0,. + Te) [6.7] 


对 这 n 个 人 取 平 均值 之 后 ， 便 得 到 对 这 些 人 增长 参数 估计 的 一 个 总 的 、 概 括 性 
的 可 靠 性 指标 。 根 据 自 然 科学 知识 的 数据 ， 对 初始 状况 和 增长 率 估计 的 可 靠 性 
分 别 为 0.854 和 0.799 ( 见 表 6.1) 。 这 些 结果 表明 ， 不 论 是 初始 状况 还 是 增长 
率 方面 ， 数 据 中 有 足够 的 信息 量 ， 因 此 确保 了 将 每 一 参数 作为 个 人 层次 变量 的 
PARA KE 

变化 与 初始 状况 的 相关 。 个体 变化 与 初始 状况 之 间 的 相关 性 是 许多 变化 研 
究 的 重要 内 容 之 一 。 然 而 ， 在 一 个 简单 的 前 测 一 后 测 设计 中 很 难 对 这 种 关系 得 
出 一 个 一 致 性 估计 。 研 究 者 通常 发 现 ， 在 前 测 一 后 测 研究 中 会 存在 初始 状况 与 
增长 率 之 间 的 虚假 负 相关 ， 这 种 相关 关系 的 出 现 是 因为 前 测 时 的 测量 误差 和 观 
察 的 变化 值 之 名 有 负 相 关 。 

然而 ， 利 用 多 次 观察 数据 就 可 以 得 到 初始 状 总 与 真实 变化 之 间 相 关 的 一 臻 
性 估计 。 在 个 人 线性 增长 模型 中 ， 这 种 相关 关系 就 是 rw 和 ri。 类似 于 方程 
2.3， 有: 


P(t.) = Tym +a) [6.8] 


从 自然 科学 测量 成 绩 的 数据 来 看 ， 真 实 变化 与 真实 初始 状况 之 间 的 相关 估计 为 


:i 每 个 人 部 有 一 套 狐 特 的 可 靠 性 ， 在 经 典 测 最 理论 中 看 上 去 是 很 奇怪 的 ， 因 为 经 典 测量 理论 将 可 
靠 性 定义 为 应 用 于 总 体 的 测量 手段 的 特征 。 然 而 ， 经 典 定 义 总 是 假定 ， 标 准 的 测量 手段 是 用 于 
所 有 抽 中 样本 上 的 。 在 现代 应 用 中 ， 如 提 稚 检验， 每 个 案例 都 可 以 有 一 套 不 同 的 检验 项 目 。 

DO ”我 们 可 以 估计 在 个 人 层次 变量 与 增长 参数 之 间 的 联系 ， 这 种 联系 的 估计 精度 取决 于 个 人 总 数 n 
和 增长 曲线 估计 的 可 稳 性 ， 内 此 ， 如果 可 靠 性 较 低 ， 那 么 为 了 得 到 一 定 的 精度 就 需要 一 个 更 大 
规模 的 样本 。 
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-0.278。 这 就 意味 着 在 进入 这 个 项 目 之 前 自然 科学 知识 较 少 的 学 牛 ， 其 知 
识 将 有 可 能 会 以 稍 快 的 速度 增长 。 我 们 可 以 断定 ， 它 们 是 真正 的 负 关系 ， 而 不 
是 测 基 过 程 中 的 虚假 结果 注意， 初始 状况 与 增长 率 之 间 的 相关 性 会 根据 所 选 
择 的 初始 状况 的 时 间 点 不 同 而 发 生变 化 。 如 前 所 述 ，ro 的 意义 取决 于 年 龄 即 
时 间 变 量 的 测量 a, 。 


以 截 距 和 和 斜率 作为 结果 的 模型 

层 -1 模型 仍然 用 方程 6. 3。 现 在 在 层 - 2 模型 中 加 入 两 个 自 变 量 ， 母语 
(LANGUAGE， 表 示 学 生 的 母语 的 虚拟 变量 : | 为 非 英 语 ，0 WRIA); 课时 
(HOURS， 为 连续 变量 ， 表 示 儿 童 在 项 目 进行 的 一 年 中 直接 二 课 的 小 时 数 ) 。 
现在 ， 个 人 层次 的 模型 为 : 


mu = By + Bo, (LANGUAGE), + By, (HOURS), + ry, [6.9] 
以 及 
m, = By +B, (LANGUAGE), + B,,( HOURS), +r, (6. 10) 


K 6.2 列 出 了 这 一 分 析 所 估计 的 固定 效应 的 结果 。 


R62 自然 科学 知识 增长 的 线性 模型 结果 (母语 和 课时 的 效应 ) 








国定 效应 系数 标准 误 se + 比率 
eT) Caen _— 
RE, Boo 0. 895 0. 267 3.35 
AI. Bo -0.463 0. 304 -1.52 
RH, Bo: 1.523 x10 °? 0.853 x107? 1.79 
增长 率 模型 mh 

WUE, Bio 0. 029 0. 039 0.74 
Rit, Bu 0, 187 0.045 4,20 
课时 、B: 4,735 x10~* 1.252 x10~* 3.78 





不 论 是 母语 或 者 是 课时 都 与 初始 能 力 没有 很 强 的 关系 。 两 者 的 ! 值 都 小 于 
2.0。 但 是 ， 其 效应 估计 的 结果 却 是 合理 的 。 一 般 而 言 ， 说 西班牙 语 的 儿童 比 
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说 英 请 的 儿童 的 起 点 要 低 0. 463 个 logit fë, HI Au = -0.463。 在 本 项 研究 中 
经 常会 碰 到 ， 尽管 以 非 英语 为 母语 的 儿童 在 初始 状况 时 成 绩 较 低 ， 但 他 们 的 进 
步 速 度 却 较 快 

课时 与 初始 状况 之 间 的 正 向 关系 也 是 合理 的 ， 因 为 第 一 次 测试 的 时 间 是 在 
项 目 开 始 年 份 的 前 6 ~ 14 周 进行 的 。 正 是 由 于 儿童 已 经 上 了 一 段 时 间 的 课 ， 所 
以 这 种 正 效应 也 就 不 足 为 奇 了 。 

仁 语 与 课时 都 与 个 体 增长 率 有 显著 的 关系 。 相 对 于 母语 为 英语 的 儿童 ， 那 
些 母 语 为 西班牙 语 的 儿童 的 测试 成 绩 平均 每 月 的 增长 率 要 快 0. 187 个 logit 单 
位 ， 即 ,=0.187。 类 似 地 ， 每 年 每 增加 一 个 小 时 的 课时 ， 将 会 使 增长 率 提高 


0. 000474 个 logit 单位 ， 即 B,。=0.000474- 为 了 理解 后 一 个 结论 ， 我 们 可 以 候 
设 是 在 考察 具有 相同 母 诸 但 所 上 课时 不 同 的 两 个 儿童 的 期 望 增长 率 。 有 具体 地 
说 ， 可 以 假设 第 一 个 儿童 平均 每 个 月 上 40 小 时 的 辅导 课 ， 而 另 一 个 则 上 80 个 
小 时 (这些 数字 约 为 研究 项 目 中 的 最 大 值 与 最 小 值 ) 。 这 一 模型 表明 ， 在 9 个 
月 的 时 间 里 ， 新 增加 的 每 月 40 个 小 时 的 课时 将 会 使 第 二 个 儿童 的 增长 率 额外 
地 增加 9 x40 x0.0004735 =0. 170 个 logit 单位 。 这 也 就 是 说 ， 对 于 平均 每 个 月 
上 课时 间 为 80 个 小 时 的 儿童 来 说 ， 他 们 每 月 的 增长 率 将 比 只 有 40 个 小 时 的 儿 
童 的 增长 率 高 出 0. 170 个 logit 单位 。 

表 6.3 列 出 了 模型 中 随机 效应 的 估计 方差 ， 并 将 它们 与 无 条 件 模型 (方程 
6.5) 相 比 较 。 按 照 方程 4. 24， 解 释 方 差 比例 是 总 方差 (根据 无 条 件 模型 估 
计 ) 与 残 差 方差 (根据 拟 合 模型 估计 ) 之 差 与 总 方差 的 比值 。 在 这 一 自然 科 
学 测试 成 绩 研究 中 ， 母 语 和 课时 这 两 个 变量 解释 了 初始 状况 的 54. 9% 的 参数 
方差 ， 解 释 了 增长 率 的 75.6% 的 参数 方差 。 


表 6.3 初始 状况 和 增长 率 中 由 母语 与 课时 所 解释 的 方差 








模型 初始 状况 ，Var( rs,) MEKE, Varm) 
i 无条件 模 于 l 1. 689 0. 041 
EA BE i ADR BY 29 A FF BO BERE” 0.761 0.010 
解释 方差 比例 54.9 75.0° 


— — — — — — — — — 
fh: a 根据 表 6.1; b ETRO 2ER AU HEE N 


* 依 数值 计算 .此 处 应 为 75.6 一- 译 何 注 
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二 次 增长 模型 


在 这 一 节 中 ， 我 们 示范 一次 增长 模型 的 应 用 ， 并 说 明 在 建立 模型 的 过 程 中 
如 何 应 用 各 种 假设 检验 。 因 此 ， 层 - 1 模型 现在 就 变 成 下 面 的 形式 : 


Y, = m, tm la, L) +m, la,- L) +e, [6.11] 


前 面 我 们 曾经 介绍 过 层 - 1 自 变 量 为 a, 的 舞 时 可 参照 一 种 特定 的 或 称 预先 的 
(priori) 常数 上 对 中 。 这 样 ， 方 程 6.11 中 每 个 增长 参数 都 有 了 实际 意义 。 
RE rw 代表 第 i 个 人 在 时 间 世 时 的 状况 。 线性 分 量 系数 r, 是 指 第 工人 个 人 在 
时 间 了 上 时 的 瞬时 增长 率 ， 而 r* 则 是 指 每 一 增长 轨迹 的 曲率 或 者 加 速度 。 尽 
管 加 速度 是 整个 轨迹 的 特征 ， 但 初始 状况 和 瞬时 率 参 数 还 是 依赖 于 上 值 的 特 
殊 取 值 。 

在 层 -2， 我 们 专门 为 每 一 个 层 -1 RM, GE p=0, 1, 2) 建立 各 自 
的 方程 ， 即 : 


* 
Tu = Bo + DPN + [6.12] 


层 -2 随机 效应 的 方差 协 方差 六 现在 形成 一 个 3 x 3 的 矩阵 : 





To 对 称 
T=| o 7u 
T» — 
Var( my) 对 称 
= 区 Fausa) Var(m,;) | 
Cov Mus Mo) Cov(Ta mi) Var(ma) 


例子 : 母亲 的 语言 能 力 对 儿童 词汇 量 的 影响 


这 里 ， 我 们 将 利用 儿童 在 1 岁 时 间 汇 发 展 状 况 的 有 关 数 据 ( Huttenlocher 
etal. ，1991) ， 来 说 明 二 次 增长 模型 的 应 用 。Huttenlocher 等 人 的 研究 假设 是 : 
在 家 里 ， 才 亲 的 语言 能 力 对 儿童 早期 词汇 的 获取 有 着 重要 的 影响 。 儿 童 的 性 别 
差异 同样 对 之 也 有 影响 。 
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数据 实际 上 包含 两 个 密切 相关 的 研究 : 第 一 个 研究 总 共 考 察 了 11 名 儿童 ， 
在 其 年 龄 为 14 ~26 个 月 期 间 ， 每 两 个 月 他 们 将 在 家 中 接受 观察 ， 总 共 大 概 是 
六 L 次 《有 些 案例 的 第 14 个 月 的 记录 是 缺失 的 ) 。 每 个 观察 点 上 每 个 儿童 的 
Wi ht 都 是 从 这 些 观 察 中 得 到 的 。 存 第 一个 研究 中 ,另外 的 11 名 儿童 分 别 
在 其 年 龄 为 16、20、24 个 月 时 接受 观察 。 同 时， 这 两 个 研究 都 记录 了 儿童 在 
16 个 月 时 扩 灯 的 词汇 最 ， 

利用 分 层 分 析 方法 来 研究 个 体 变化 的 一 个 优点 是 : 像 上 例 那 样 不 同 的 重 
复 测量 模 式 可 以 被 结合 到 一 个 分 析 中 来 。 但 是 ， 由 于 上 述 两 个 研究 在 程序 上 
有 一 些 细 微 的 差别 ， 研 究 者 就 会 担心 将 两 个 研究 的 数据 结合 在 一 起 是 否 会 有 
问题 ， 但 是 如 果 将 两 个 研究 分 别 进行 分 析 的 话 ， 又 有 可 能 会 因为 每 个 分 析 的 
功效 太 小 而 可 能 无 法 检测 其 中 的 重要 关系 。 这 里 所 要 描述 的 是 如 何 将 这 两 个 
研究 结合 在 一 起 ， 而 又 能 够 对 学 习 效应 以 及 学 习 与 个 人 之 间 的 交互 效应 进行 
严格 的 检验 。 


随机 系数 回归 模型 

观察 图 6. 1 中 每 个 儿童 的 词汇 量 增长 曲线 ， 其 中 清楚 地 表明 了 非 线性 的 增 
长 模式 。 事 实 上 ， 所 有 22 个 案例 的 轨迹 都 是 加 速 增长 的 曲线 ， 这 表明 新 闻 汇 
的 掌握 是 随 着 时 间 而 不 断 增长 的 。 这 些 观测 值 说 明 可 以 用 方程 6. 11 的 二 次 增 
长 模型 来 进行 拟 合 。 

对 中 参数 上 被 有 意 地 设 在 12 个 月 的 时 候 ， 这 是 因为 大 部 分 儿童 都 是 在 这 
个 时 候 开始 说 出 他 们 的 第 一 句 话 。 因 此 ，rw 表 示 儿 童 在 第 12 个 月 时 的 词汇 
ft. 但 它 应 该 接近 于 0， 而 ,是 在 第 12 个 月 时 的 瞬时 增长 率 ， 它 也 应 该 接近 
于 0， 这 是 因为 以 往 的 研究 表明 ， 在 开始 时 词汇 量 的 增长 是 很 慢 的 。 

通常 ， 研 究 者 总 是 从 无 条 件 的 层 -2 模型 开始 ， 即 : 


To, = By tm [6. 13a] 
T, = Bo +r, [6. 13b] 
Ty, = Br t Fr, (6. 130) 


表 6. 4 中 列 出 了 结果 。 在 年 龄 为 12 AHR, FHER AFE KEREN 
接近 于 0 (注意 ， 两 个 参数 的 系数 估计 都 远 小 于 它们 各 自 的 标准 误 ) 。 平 均 加 
BEEE (B B =2.035)， 而 且 也 非常 显著 。 这 表明 ， 一 般 而 言 ， 儿 童 党 
担 新 闻 汇 的 增长 率 随 着 时 间 而 不 断 提 高 。 
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800 


È 





.儿童 7 
4 儿童 5 
儿童 11 





2 14 16 18 2 22 24 2% 
年 龄 {以 月 为 单位 ) 


图 6.1 个 人 词汇 量 增长 轨迹 的 几 个 示例 
资料 来 源 : Huttenlocher, Haight, Bryk, & Seltzer (1991). 
TE: B. O, ALAA. 名 清 曲 线 根据 对 每 个 儿童 的 词汇 量 数据 氢 合 二 次 多 项 式 取得 。 


表 6.4 模型 1: 词汇 量 增长 的 完全 二 次 增长 模型 











同 定 效应 系数 标准 误 se te 

第 12 个 月 时 的 平均 词汇 最- Boo -3.879 5.427 -0.715 = 

第 12 个 月 时 的 平均 增长 率 , Bio -0.327 2. 295 -0. 143 

FMB, Bry 2.035 0. 200 10. 172 

随机 效应 方差 分 最 自由 度 df x p it" 
”第 12 个 月 时 的 状态 ， Pa 62. 307 10 0. 790 >0. 500 

MKE. n, 46. 949 10 6.211 >0. 500 

MWE. r, 0. 510 10 17. 434 0. 065 

民 -1 RI, e, 676, 882 


Deviance = 1277.03 , df=7 





注 : w 这 些 结 果 是 根据 11 个 案例 得 到 的 ， 其 中 每 个 儿童 的 数据 足以 分 别 进行 OLS TN, itita 
A p 值 则 由 于 样本 几 较 小 而 只 是 粗略 的 近似 值 。 


- 般 来 说 ， 在 某 一 特定 年 龄 上 的 增长 率 是 增长 率 模型 对 年 龄 的 一 阶 导 数 。 
对 于 二 次 增长 模型 来 说 ， 
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年 龄 上 时 的 增长 率 = mr +20, la, = L) [6.14] 


例如 ， 在 年 龄 为 14 个 月 时 ,平均 增长 率 是 平均 每 月 增加 7.81 个 新 单词 【 即 
-0.327 +2(2.035)(14 -12)]. 到 第 16 个 月 ,平均 增长 率 已 提高 到 平均 每 月 
增加 15. 91 个 新 单词 . 

个 体 观测 值 相对 增长 曲线 的 标准 差 是 26. 02 个 单词 (BI E = 676. 88"7) D 
与 rs 和 mi,, 相 连 的 统计 表明 ， 在 年 龄 为 12 个 月 时 所 观察 的 词汇 量 与 瞬时 增 
长 率 的 方差 主要 反映 的 是 OLS 估计 中 的 误差 方差 。 事 实 上 ， 儿 童 之 间 在 这 些 
参数 上 可 能 会 存在 显著 性 差异 ， 但 由 于 我 们 在 本 研究 中 并 没有 观测 年 龄 小 于 
14 个 月 的 儿童 的 情况 ， 因 此 缺乏 必要 的 信息 来 考察 这 种 影响 作用 。 同 时 ， 我 
们 也 注意 到 ， 在 本 例 中 由 于 半数 以 上 的 儿童 仅 有 3 个 观测 值 ， 因 此 结果 中 并 没 
有 报告 可 靠 性 统计 。 从 结果 来 看 ， 尽 管 OLS 估计 很 好 地 拟 合 了 数据 ， 但 可 靠 
性 统计 却 是 相当 具有 误导 性 的 。 

这 些 结果 表明 ， 层 -1 模型 还 可 以 简化 。 估 计 所 得 的 在 第 12 个 月 时 的 平 
均 初 始 状况 以 及 平均 增长 率 都 没有 显著 地 不 等 于 0 (而 且 事实 上 非常 小 ) 。 这 
两 个 随机 参数 的 同 质 性 假设 也 可 以 保留 。 这 些 随 机 效应 之 间 的 相关 估计 ( 见 
表 6.5) 为 模型 的 简化 提供 了 进一步 依据 。 截 距 系 数 ro 与 增长 率 7,,: 和 加 速度 
Ta 之 间 几 乎 是 线性 关系 ， 至 少 它 建 议 可 以 应 用 “无 截 距 ” 模 型 。 也 就 是 说 ， 
层 -1 模型 可 以 简化 为 


Y, = mula, -L) + Wii(o -L)? +e, [6.15] 


这 一 模型 的 结果 请 见 表 6.6。 


ROS 完全 的 二 次 模型 中 随机 系数 之 间 的 相关 











Wo my Ty; 
OR 个 月 时 的 状态 ,ma 1, 000 : 
fi 12 PABA, r, -0.982 1. 000 
WEE, my -0.895 0. 842 1. 000 





D TER, ARR -1 VELLEN, ERHAN, A, RR, E -1HRS 
变化 在 词 江 最 较 小 时 是 比较 小 的 ， 央 为 方差 异 质 性 实 奈 上 并 不 影响 所 得 到 的 关键 结果 ， 所 以 我 
们 在 这 种 介 绩 性 示范 中 略 去 不 说 了 。 具 有 更 为 复杂 的 误差 结构 的 层 -1 模型 将 在 本 章 的 后 面 巴 
以 详细 讨论 ， 
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表 6.6 模型 2: 词汇 量 增长 的 二 次 增长 模型 (AME) 











IM RO 系数 标准 误 se :比率 
第 12 个 月 时 的 乎 均 增长 不, Bo -1294 1557 -0.83l — 
FEME., Bw 2. 087 0. 205 10, 201 
随机 徐 点 Wy 5 Wie 自由 度 af x piti 
ERE. a S aw a SD oos 
WER. ry, 0, 663 21 89. 359 0. 000 
层 -1 BOB, e 709. 231 


Deviance = 1285. 02, df=4 





第 一 个 模型 中 的 基本 发 现在 简化 模型 中 得 到 了 支持 。 在 第 12 个 月 时 的 半 
均 增 长 康 仍 然 接近 于 0， 而 平均 加 速度 也 并 没有 什么 显著 的 变化 。 个 体 观测 什 
相对 增长 曲线 的 标准 差 略 有 点 提高 [6 = Var(。,)'”=26.63]， 这 表明 无 堆 
距 的 层 -1 模型 对 数据 的 拟 合 与 最 初 的 模型 基本 相同 。 与 随机 增长 率 和 加 速度 
参数 相连 的 六 统计 量 表明 ， 这 两 个 参数 在 不 同 个 体 之 问 存在 很 大 差异 。 

两 个 随机 系数 之 间 的 相关 仍然 很 高 ， 达 到 0. 904。 它 表明 ， 对 参数 同 质 性 
的 Xe 检验 可 能 是 误导 ， 因 为 它们 是 独立 的 单 变量 检验 ， 并 没有 考虑 到 随机 效 
应 之 间 的 关系 。 

作为 核对 ， 我 们 进行 了 似 然 比 检验 ( 见 第 3 章 )， 具 体 地 说 ， 我 们 将 第 二 
个 模型 的 偏差 度 统计 (Deviance = 1285. 02， 自 由 度 df =4) 与 另 一 个 模型 中 相 
应 的 偏差 度 统计 做 比较 ， 在 后 一 个 模型 中 假设 瞬时 增长 率 r, 是 固定 效应 。 这 
样 ， 增 长 率 的 方差 和 增长 率 与 加 速度 之 间 的 协 方差 就 被 限制 为 0。 也 就 是 说 ， 
层 -1 模型 仍然 为 方程 6. 15， 但 层 -2 模型 为 ， 


Ti = Bua (6. 16] 


Ta = Bu th, 
替换 模型 的 偏差 度 统计 为 1292.03， 自 由 度 df =2。 两 者 在 偏差 度 统计 量 上 的 
差 为 7.01， 这 个 差 服 从 自由 度 为 2 的 好 分布。 其 检验 结果 非常 显著 (p< 
0.001) ， 表 明 模 型 的 简化 并 不 恰当 。 这 个 结果 也 证 实 了 单 变量 的 同 质 性 检验 ， 
并 且 随 机 增长 率 分 量 应 当 保 留 在 模型 中 。 
然而 ,我 们 还 可 以 做 另 一 种 简化 ， 即 把 平均 增长 率 系数 规定 为 0。 也 就 是 
说 , 层 -1 模型 仍然 像 方程 6. 15 一 样 不 变 ， 而 层 -2 模型 则 变 为 : 
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— [6.17] 


Ty = By +h 


46.7 列 出 了 这 种 “最 好 的 ”模型 设置 的 结果 


—6.7 模型 3: 词汇 量 增长 的 二 次 模型 (线性 增长 率 中 既 无 截 距 也 无 固定 效应 ) 








周 定 效应 系数 标准 襄 se + 比率 
平均 加 速度 Pa — >=" 2 098 J o 206 10. 172 四 
随机 效应 Hy St tt 自由 度 df x p ifi 
MEK miss SCAT 
MEE, r, 0. 685 21 88. 528 0. 000 
hi -I BE, en 708. 085 


Deviance = 1286, 57, 4 =4 


以 截 距 和 斜率 作为 结果 的 模型 : 母亲 的 语言 能 力 、 性 别 及 研究 组 的 作用 
在 已 经 确定 了 层 -1 模型 后 .研究 者 将 继续 检验 有 关 的 研究 假设 。 上 基体 地 
说 ， 他 们 提出 下 面 的 个 人 层次 的 模型 ; 


有 Sy [6. 18a} 
T,，= 有 +pB(STUDY);, + By (SEX), 
+ B.,( MOMSPEECH), + B, (STUDY x SEX), (6. 18b] 
+ By (STUDY x MOMSPEECH), + ry 


方程 6. 18a 设置 ,为 纯 随 机 效应 模型 。 这 个 层 -2 方程 像 前 面 的 模型 一 
样 ， 其 中 没有 截 距 ， 因 为 平均 增长 率 被 限制 为 0。 个 体 加 速度 参数 的 变化 被 设 
定 为 以 下 几 个 变量 的 琐 数 : 研究 组 (STUDY) (第 一 组 = -1; 第 二 组 =1); 
儿童 的 性 别 (SEX) (男性 = -1， 女 性 =1); 母亲 的 语言 能 力 (说话 时 所 用 
的 词汇 基 ， 以 自然 对 数 单位 计 ， 并 以 总 平均 数 对 中 ); 以 及 研究 组 分 别 与 性 别 
和 和 母亲 的 语言 能 力 之 间 的 两 个 交互 项 〈 注 意 : 这 里 对 STUDY 和 SEX 重新 编码 
为 -1 和 1 主要 是 为 了 检验 它们 的 交互 效应 ) 。 模 型 的 结果 请 见 表 6. 8。 
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表 6.8 最 终 的 二 次 增长 模型 








Wh aE Re 系数 标准 误 se 比率 
学 均 加 速度 ， mv 
RA. By, 2.031 0, 157 12, 887 
人 研究 组 效应 (STUDY), By -0.433 0. 157 -2,747 
性 别 效 应 (SEX). Bn 0. 312 0. 165 1. 891 
RERIN NIEJ (MOMSPEECH), Bn 0. 793 0. 334 2. 370 
OE FEA — TE HS H (STUDY x 
0. 144 0.165 0. 876 
SEX), Bu 
ITH — ARM A E eM (STUDY x 
-0.158 0. 334 -0.473 
SPEECH), By 
随机 效应 Ay 3 St tit 白 由 度 df x p fti 
MKE. r 18. 778 22 39. 547 0,010 
ME. ry, 0. 282 16 39. 864 0,001 
ha - 1 BLE, e, 707. 156 


Deviance = 1284.3, df=4* 
注 ; a 表 6.6-6.8 ME RT MOLT. Ae ARTA, HP 
KEHAS BL AT SAE Bt ALAR HE MLR (WN 3 章 ) 





两 个 研究 组 的 平均 加 速度 存在 着 显著 的 差异 ， 达 0. 866 字 / 月 : [ 即 第 一 组 
的 效应 -第 二 组 的 效应 = (~- 1)( -0.433) -(-1)(-0.433)] 。 造 成 这 种 差 
异 的 原因 是 由 于 在 两 个 研究 中 对 于 各 个 年 龄 上 总 词汇 量 的 估计 程序 略 有 不 同 。 
正如 我 们 所 假设 的 那样 ， 女 孩 的 平均 如 速度 显著 地 高 于 男孩 ， 差 值 达 0. 624 字 / 
AC. 类似 地 ， 母 亲 说 话 时 所 用 的 词汇 量 对 于 二 子 学 习 词 汇 有 正 效应 (Ba = 
0.793, ¢=2.370) 。 而 孩子 性 别 与 母亲 词汇 量 的 交互 效应 在 两 个 研究 组 之 间 没 
有 太 大 的 差异 ; 也 就 是 说 ， 两 个 交互 效应 相对 较 小 ， 而 且 也 不 显著 (uA fs 
的 : 值 均 小 于 1.0)。 因 此 ， 我 们 有 了 一 些 信心 来 解释 将 这 两 个 研究 的 数据 汇 
合 在 一 起 的 分 析 结 果 。 加 速度 参数 r, 的 残 差 方差 从 无 条 件 模型 总 参数 方差 
为 0.685 ( 见 表 6.7) 减少 到 0.282， 个 人 加 速度 的 变化 中 约 有 59% [ 即 
(0. 685 -0. 282) /0.685] 与 研究 组 、 儿 童 性 别 以 及 母亲 的 语言 能 力 有 关 。 

一 般 来 说 ， 分 层 分 析 担 供 了 确 茧 证 据 表明 ， 母 亲 的 语言 能 力 和 儿童 性 别 对 
词 沪 量 掌握 有 重要 的 作用 。 当 只 控制 研究 组 后 ， 词 汇 量 增长 加 速度 的 残 差 方 差 
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为 0.551 (即将 方程 6. 18b 简化 为 只 剩 下 变量 STUDY ) 。 当 将 无 显著 作用 的 交 
互 项 从 方程 6. 18b 中 剔除 并 重新 估计 最 终 模 型 时 ，z: 的 残 差 方 差 为 0.257。 比 
较 这 些 结果 可 以 发 现 ， 在 控制 了 人 赋 究 组 之 后 ， 加 速度 参数 的 残 差 方 差 中 的 
53.4% 与 儿童 性 别 和 人 母亲 的 语言 能 力 有 关 。 


其 他 形式 的 增长 模型 


前 两 节 中 所 描述 的 程序 可 以 直接 推广 到 更 为 复杂 的 增长 寞 型。 原则 上 ， 只 
要 时 间 序 列 足 够 长 ， 任 何 阶 次 的 多 项 式 都 可 以 被 拟 合 和 检验 。 但是， 至 少 对 于 
层 -2 的 某 些 单位 而 言 (比如 上 例 中 的 儿童 ) ， 观 测 次 数 7, 必须 多 于 个 人 增长 
模型 (方程 6.1) 中 所 设置 的 随机 参数 的 个 数 P+ 1。 只 要 这 一 点 符合 条 件 ， 
其 他 一 些 单位 即使 不 符合 这 一 条 件 也 可 以 被 包括 到 分 析 中 来 。( 有 关内 容 请 见 
第 3 章 中 对 “ 降 秩 数据 ”的 讨论 细节 ， 它 是 指 部 分 单位 没有 足够 数据 分 别 进 
47 OLS 估计 的 条 件 下 的 估计 。) 

不 同 的 年 龄 单位 可 以 通过 转换 结果 变量 或 者 是 先 转换 年 龄 变量 再 进行 以 上 
步骤 之 后 ， 很 容易 地 被 纳入 模型 中 。 例如， 在 词汇 量 研究 中 (Yu) 可 以 被 用 
作 结果 变 量 ， 便 可 以 用 线性 增长 模型 来 拟 合 这 个 平方 根 的 测量 。 一 般 来 说 ， 我 
们 建议 先 对 个 人 及 平均 的 时 间 序 列 轨迹 图 做 必要 的 察看 ， 以 便 识别 适合 于 拟 合 
这 一 数据 的 可 能 模型 。 我 们 同样 也 注意 到 ， 平 均 增长 曲线 和 个 人 增长 曲线 可 能 
会 有 不 同 的 模式 。 比 如 ， 在 对 数据 进行 二 次 增长 模型 的 拟 合 时 ， 我 们 可 能 会 发 
现 ， 一 些 正 曲率 的 个 人 增长 轨迹 掩盖 了 另外 一 些 负 曲率 的 个 人 增长 轨迹 。 在 这 
种 情况 下 ， 一 条 曲线 可 能 会 很 好 地 代表 平均 水 平 的 曲线 ， 但 并 不 能 完全 代表 个 
人 增长 的 信息 。 正 是 由 于 这 个 原因 ， 我 们 在 随机 系数 回归 中 要 对 平均 增长 参数 
和 个 体 围绕 其 变化 的 范围 进行 检验 。 

我 们 也 注意 到 ， 当 结果 是 离散 变量 时 ， 同 样 也 有 可 能 表现 出 个 人 增长 现 
象 。 在 这 种 情况 下 ， 我 们 可 能 会 希望 建立 某 种 事件 的 发 生 概率 随时 间 变 化 的 模 
型 ， 或 者 是 对 某 些 行为 的 变化 率 建 模 ， 比 如 在 青少年 阶段 的 犯罪 倾向 。 离 散 型 
结果 变量 将 在 第 10 章 中 介绍 。 


ER -1 误差 结构 更 为 复杂 时 的 情况 


直到 现在 ， 我 们 都 是 假定 了 一 个 简单 的 层 - 1 误差 结构 ， 即 : 每 个 误差 项 
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6, 痢 是 独立 的 ， 而 且 都 服从 于 均值 为 0、 方 差 为 常数 o? 的 正 态 分 布 ， 但 这 里 有 
儿 种 更 为 一 般 的 可 能 性 

1 有 可 能 与 层 -1 或 层 -2 的 测量 特征 有 关 。 例 如 ， 在 词汇 量 增长 的 数 
据 中 ， 我 们 可 以 规定 o) 是 年 龄 的 琴 数 ， 因 为 在 层 -1 中 越 往 后 的 时 点 上 异 方 
PERK. 同样， 其 -1 异 质 性 中 的 异 方差 性 可 以 用 性 别 或 者 研究 组 的 函数 来 
表示 

2. 如 果 数 据 是 按时 间 模 式 的 ， 比 如 在 词汇 量 增 长 的 例子 中 ， 如 果 时 间 上 对 
应 12，14，16，…，26 个 月 ， 那 么 另外 一 种 选择 就 是 分 别 估计 出 每 一 时 间 点 
上 的 层 -1 方差 

这 上 贤 种 可 能 都 可 以 通过 转换 来 完成 ， 即 用 对 数 线性 模型 (log-linear model) 
HH of 作为 测量 特征 〈〔 如 年 龄 、 性 别 或 者 是 一 套 时 点 的 虚拟 变 荆 ) a 
数 。 我 们 存 第 5 章 中 示范 过 这 种 分 层 模型 的 扩展 〔( 见 “ 层 -1 方差 异 质 性 情况 
下 的 应 用 ”) o 

3. 每 个 人 的 误差 项 6, 之 间 有 可 能 自 相 关 : 例如， 我 们 可 以 设置 一 个 一 阶 
自 回归 “AR(1)” 模 珊 。 这 导致 了 一 个 结构 ， 其 中 任何 一 个 时 点 + 上 的 误差 都 
依赖 于 前 一 个 时 点 - 1, 

对 于 这 种 变化 的 应 用 将 在 后 面 的 “比较 分 层 模型 、 多 元 重复 测量 模型 和 
结构 方程 模型 ”一 节 中 示范 。 


分 段 线性 增长 模型 


对 数据 的 探测 型 检查 表明 是 非 线 性 时 ， 一 种 选择 是 将 曲线 增长 轨迹 拆 分 成 
几 段 。 当 我 们 希望 从 实际 意义 上 比较 两 段 不 同时 期 中 的 增长 率 时 ， 这 种 方法 就 
特别 有 吸引 力 。 可 能 的 研究 问题 包括 :“ 第 一 段 时 期 的 增长 率 上 的 差异 是 否 比 
第 一 段 更 大 ?”;“ 这 两 段 时 期 中 的 增长 率 的 影响 因素 是 否 相 同 ?” 

例如 ，Frank 和 Seltzer (1990) 曾 对 芝 加 斌 公立 学 校 一 年 级 到 六 年 级 之 间 
学 生 阅 读 能 力 的 提高 做 了 调查 ， 在 每 个 学 年 未 对 每 个 学 生 安排 一 次 测试 ， 但 由 
于 各 种 原因 ， 某 些 学 生 一 次 或 多 次 未 能 参加 其 中 的 测试 .根据 性 别 、 种 族 和 学 
校 分 别 选择 部 分 样本 ， 对 某 些 个 人 和 子 类 样本 的 增长 轨迹 做 探索 性 分 析 后 发 
现 ， 一 年 级 到 三 年 级 之 间 的 学 生 在 提高 阅读 能 力 时 与 四 年 级 以 上 的 同学 存在 着 
模式 于 的 差异 。 前 者 的 增长 率 与 后 者 相 比 ， 表 现 出 速度 更 快 、 差 别 更 大 的 特 
点 。 这 个 结果 表明 ， 可 以 利用 两 段 的 线性 增长 模型 来 尝试 拟 合 : 第 一 段 时 期 用 
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-个 统一 的 增长 党 。 后 一 段 时 期 用 另 一 个 不 同 的 增长 率 。 具 体 地 说 ， 层 -1 模型 
可 以 设 为 : 


Pa = My + Ril + Wt, + ey [6.19] 


Hp, an 和 as 分别 为 表 6. 9a HERE XWR AE, ANP BAIA. 

尽管 表 6. 9a 中 所 列 的 编码 方式 乍 看 上 去 似乎 很 奇怪 ， 但 如 果 将 简单 的 数 
值 代 入 方程 6. 19 中 的 ea, 和 ay， 并 得 到 预测 结果 ， 那 么 这 个 编码 过 程 也 就 不 奇 
Er. 例如， 利用 表 6. 9a 中 的 第 一 种 编码 ， 每 个 年 级 的 预测 状况 就 将 变 为 : 
To. Wy tM. Wy +27 No +m, +, Wy +2N +27:， 以 及 mo +27, +37, 
内 此 ,在 二 、 三 年 级 时 ， 每 年 的 增长 率 均 为 m, MEWN, K. RERI, 
年 的 增长 率 则 为 r:。 


R69 分 两 段 线性 模型 时 所 用 的 几 种 可 能 的 编码 方法 ( 以 阅读 成 缚 为 例 ) 
Ca) 两 种 增长 率 的 模型 











生 级 
$ 2 3 4 5 6 7 的 解释 
“a 0 1 2 2 2 2 m, 第 一 阶段 的 增长 率 
u 0 0 0 1 2 3 72 第 二 阶段 的 增长 率 
To 一 年 级 时 的 状 疯 
a, -2 -1 0 0 0 0 Ti 第 一 阶段 的 增长 率 
ny, 0 0 0 ] 2 3 m: BOM RE 
mo 三 年 级 时 的 状况 
(b) hit (WA) 模型 
年 级 
1 2 4 $ 6 也 的 解释 
a, o 1 2 3 4 Som, RMR 
ay, 0 0 0 1 2 3 ra WOR RAR (Wi) 
mo 一 年 级 时 的 状况 
ay -2 -1 0 1 2 3 T 基准 增长 率 
a, 0 0 0 1 2 3 m BORA CRA) 
To 三 年 级 时 的 状况 





图 6.2 提供 了 Frank 和 Seltzer (1990) 报告 的 50 个 案例 的 增长 轨迹 ， 是 





170 ”分 层 线性 模型 : 应 用 与 数据 分 析 方法 


阅读 
成 绩 
(logit) 








年 级 
图 6.2 阅读 成 绩 的 轨迹 图 的 示例 (经 验 贝 叶 斯 估计 ， 节 加 哥 公 立 学 校 数 据 ) 


根据 方程 6. 19 和 层 -2 无 条 件 模型 计算 的 ， 其 中 mo. m, 和 ma 设置 为 随机 效 
应 。 这 些 显示 的 轨迹 是 经 验 贝 叶 斯 估计 值 ， 或 称 收缩 估计 ， 其 公式 为 : 


a) = Am, + (1 A)" [6.20] 


其 中 : 
元 是 3x1 的 向 量 OLS 估计 值 (地 ,六 ;， 广 ,)"， 是 根据 个 人 数据 对 个 人 
增长 参数 的 估计 ; 
有 B 是 一 个 3 xl 的 向 量 ， 包 含 了 描述 平均 增长 轨迹 的 三 个 参数 的 估计 值 ; 
A, 是 一 个 3 x3 的 、 对 第 i 个 人 的 多 变量 可 信 度 矩阵 (见方 程 3.57) 。 
我 们 注意 到 ， 方 程 6. 19 这 种 两 段 线性 增长 模型 可 以 被 参数 化 ， 作 为 整个 
时 期 (从 一 年 级 到 六 年 级 ) 的 基准 增长 率 ， 以 及 在 第 一 和 第 二 阶段 时 基准 增 
长 率 的 增 量 或 减 量 ) 。 如 果 按 表 6.9b 中 示范 的 方式 那样 对 ou, 和 os, 编码， 就 
可 以 完成 这 种 工作 。 


随时 间 变 化 的 协 变量 


在 某 些 应 用 中 ， 除 了 年 龄 或 时 间 外 ， 我 们 可 能 用 其 他 形式 的 层 -1 自 变量 
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来 解释 7 的 变化 。 我 们 将 这 些 指标 称 为 随时 间 变 化 的 协 变量 (time-varying co- 
variates) 。 例 如 ， 在 阅读 能 力 研究 中 ,假设 我 们 还 有 另 一 个 测量 指标 来 表示 每 
-年 级 学 生 的 缺席 状况 ， 试 想 ， 如 果 一 个 儿童 在 一 个 学 年 中 缺席 了 很 长 一 段 时 
间 ， 圭 么 ， 这 个 儿童 在 期 末 时 所 能 取得 的 成 绩 肯 定 会 低 于 个 人 增长 轨迹 的 预测 
值 。 这 种 临时 的 变化 可 以 通过 在 方程 6. 19 的 层 -1 模型 中 加 入 学 生 的 一 个 缺 
席 的 指标 来 表示 。 具 体 地 说 ， 当 我 们 定义 ex 为 在 某 一 阶段 的 缺席 状态 ， 那 么 ， 
层 -1 模型 就 成 为 ; 


Ya = Me + Tyg + Tyly + Tyly + es [6.21] 


由 于 学 生 缺 席 是 作为 一 个 协 变量 ， 在 形式 上 将 它 设 为 层 -2 中 的 固定 效应 
( 即 rs =yw)。 然 而 ， 它 同样 也 可 以 被 设 为 非 随机 变化 的 ， 例 如 ， 允 许 在 一 至 
二 年 级 和 四 年 级 以 上 这 两 个 阶段 中 有 不 同 的 效应 ， 它 甚至 可 以 被 设 为 是 随机 
的 。 我 们 将 在 第 8 章 中 用 学 生 学 习 和 暑期 退步 效应 的 三 层 模型 的 分 析 中 ， 详 细 
讨论 随时 间 变 化 的 协 变量 的 应 用 。 


个 体 变化 研究 中 层 - 1 自 变量 的 对 中 


在 前 几 童 中 我们 曾 讨 论 了 层 - 1 自 变 基 的 定位 选择 对 分 层 线性 模型 的 建 
立 与 参数 估计 有 重要 意义 ( 见 第 2 章 中 “变量 的 定位 ”和 第 5 章 中 “组 织 效 
应 研究 中 层 -1 自 变量 的 对 中 ”这 两 节 ) 。 我 们 现在 考察 在 个 体 变化 研究 中 层 -1 
自 变节 定位 有 哪些 影响 : 


。 线性 增长 模型 中 截 距 的 定义 ; 

。 在 高 阶 多 项 式 模型 中 其 他 增长 参数 的 定义 ; 
。 在 研究 随时 间 变 化 的 协 变量 时 的 可 能 偏差 ; 
。 增长 参数 的 方差 估计 。 


线性 增长 模型 中 截 距 的 定义 


考察 层 - 1 模型 ， 其 中 每 个 儿童 的 增长 都 是 用 Y 来 表示 结果 ， 它 被 表达 成 
-条 直线 : 
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Y, =m +a, +e, 


Hp, RE ary E ev =0 时 的 预测 结果 。 假 设 每 年 一 次 在 儿童 的 年 龄 为 2、3 、 
4.5. 6 岁 时 进行 观测 ， 如 果 我 们 定义 在 年 龄 为 2 岁 时 a, 等 于 0， 那 么 rw 就 是 
第 i 个 儿童 在 年 龄 是 2 岁 时 的 状态 ; 而 如 果 在 这 个 时 候 开始 收集 数据 ， 那 么 它 
又 可 以 被 认为 是 初始 状况 (我们 在 本 章 第 个 例子 里 涉及 儿童 “早期 发 育 项 
日 ”研究 中 有 关 自 然 科 学 知识 的 增长 中 ， 就 用 了 类 似 的 定义 )。 将 mw 定义 为 
初始 状况 的 有 效 性 主要 依赖 于 作为 表示 个 体 变 化 的 直线 的 准确 性 。 事 实 上 
mu 是 根据 所 有 年 龄 在 2 ~6 岁 的 案例 计算 出 的 2 岁 时 了 的 预测 值 。 如 果 增 长 赵 
势 事实 上 是 条 曲线 ， 那 么 ， 根 据 直 线 模型 所 得 的 预测 初始 状态 值 就 可 能 相当 
不 准 。 

心 的 其 他 定位 选择 也 可 以 是 (age, -4)， 即 定义 ru 是 第 ;个 儿童 在 4 岁 时 
的 状态 ， 这 是 研究 时 间 段 的 中 点 ; 或 者 也 可 以 是 (ages -6)， 这 时 的 截 距 就 是 
儿童 在 6 岁 时 的 状态 ， 即 处 于 研究 时 间 段 的 末端 。 由 于 对 中 的 选择 会 影响 对 截 
中 的 定义 ， 因 此 它 也 同样 会 影响 对 层 -2 上 的 截 距 方 差 以 及 截 距 和 和 斜率 之 间 的 
协 方差 的 解释 。 因 此 ,“ 初 始 状态 ”及 其 增长 率 之 间 的 相关 ， 也 就 会 不 同 于 年 
AA 岁 时 的 状态 及 其 增长 率 之 间 的 相关 。 而 且 对 层 - 2 模型 系数 rw 的 解释 
也 主要 依赖 于 按 ou 的 定位 选择 所 产生 的 rw 的 定义 。 


在 高 阶 多 项 式 模型 中 其 他 增长 参数 的 定义 


现在 考察 二 次 增长 模型 : 


Yy = Toi + FM, + Maray + Cu 


这 里 ， 截 距 zo 仍然 是 第 i 个 儿童 在 a =0 时 的 状态 。 然 而 ， 现 在 线性 系数 
Tu 的 定义 取决 于 w 的 定位 选择 。 在 这 个 模型 中 ， 各 年 龄 上 Y 的 增长 率 随 着 年 
龄 的 变化 而 变化 ， 而 m WER i 个 儿童 在 w =0 时 的 增长 率 。 回 顾 我 们 刚才 对 
2 ~6 岁 儿 童 评估 的 假设 例子 ， 现 在 如 果 将 a 定义 为 (sages -2)， 那 么 ru 的 定 
义 就 是 “初始 增长 率 " ， 即 儿童 在 年 龄 为 2 岁 时 的 朋 时 增长 率 。 伴 随 这 种 选择 
产生 的 一 个 问题 是 ， 数 据 几乎 没有 提供 什么 关于 儿童 初始 增长 率 的 信息 ， 而 且 
这 种 定义 还 会 使 a 和 a 这 两 个 指标 之 间 产 生 高 度 相 关 。 这 种 共 线 性 将 会 使 信 
计 过 程 变 得 不 稳定 ， 特 别 是 在 所 选 时 点 较 多 时 。 
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与 此 相 比 ， 按 “中 心 ” 即 ou =4 对 中 却 有 两 种 理想 的 效果 : 第 一 ， 这 种 对 
中 所 定义 的 zn ;不仅 是 4 岁 时 的 增长 率 ， 而 且 也 是 整个 数据 收集 阶段 的 平均 增 
KE, 或 者 说 是 “平均 速度 ” 。 这 个 数 基 对 于 某 些 研究 来 说 具有 重要 的 理论 意 
义 。 第 一 ， 按 时 段 的 中 心 来 对 中 ， 可 以 使 a 和 as 之 间 的 相关 最 小 化 ， 从 而 可 
以 使 估计 程序 稳定 化 .* 

请 注意 ， 对 二 次 项 系数 >: 的 解释 并 不 依赖 于 a, 的 对 中 选择 。 无 论 如 何 对 
中 ， 它 都 表示 加 速度 - 然而， 假设 我 们 现在 有 一 个 三 次 模型 ， 这 时 ， 截 距 、 一 
次 项 和 二 次 项 系数 的 意义 都 取决 于 a, 的 对 中 选择 ， 只 有 三 次 项 系数 的 解释 是 
不 变 的 。 一 般 而 言 ， 对 于 任意 的 多 项 式 模型 ， 最 高 阶 项 系数 的 解释 总 是 不 变 
的 ， 而 其 他 低 阶 系数 的 意义 则 取决 于 对 中 的 选择 。 


在 研究 随时 间 变 化 的 协 变量 时 的 可 能 偏差 


回想 在 组 织 研究 时 ， 如 果 层 -1 自 变 量 的 汇总 与 截 距 之 间 分 别 有 不 同 的 
关系 ， 那 么 层 -1 自 变量 的 效应 可 能 是 有 偏 的 (参见 第 5 章 “ 层 -1 固定 系 
数 的 估计 ”一 节 中 对 B. 和 局, 的 讨论 ) 。 我 们 已 经 指出 ， 以 组 平均 对 中 将 会 
消除 这 种 偏差 。 另 一 种 选择 是 将 层 - 1 自 变 重 的 平均 值 结合 到 层 - 2 的 截 距 
模型 中 ， 这 样 也 可 以 消除 这 种 偏差 。 同样 的 问题 也 会 出 现在 重复 测量 研 
究 中 。 

Horney, Osgood 和 Marshall (1995) 研究 了 生活 环境 的 变化 ( 如 就 业 和 婚 
姻 状 况 ) 与 犯罪 倾向 性 之 间 的 联系 。 数 据 是 对 犯罪 频率 较 高 者 在 三 年 内 每 月 
进行 的 犯罪 行为 的 重复 观测 值 Y,。 层 -1 随时 间 变 化 的 协 变量 (就 业 和 婚姻 状 
况 ) 也 是 每 个 月 测量 一 次 。Horney 等 人 发 现 ， 就 业 状 况 和 婚姻 状况 的 变化 与 
犯罪 素 有 关 。 特 别 是 ， 就 业 后 或 者 是 有 配偶 在 一 起 生活 以 后 ， 犯 罪 率 就 会 有 所 
下 降 。 这 种 研究 的 有 效 性 面临 的 一 个 威胁 是 ， 观 测 对 象 的 那些 随时 间 变 化 的 协 
变量 的 平均 值 也 是 有 所 变化 的 ， 有 些 人 可 能 在 大 部 分 时 间 中 就 业 了 ， 而 有 些 人 
WA; 有 些 人 在 大 部 分 时 间 (甚至 在 整个 时 期 ) 中 都 与 配偶 同 住 ， 但 有 些 
人 则 不 是 。 这 些 层 -1 自 变 量 汇 总 值 上 的 人 际 差异 可 能 与 其 犯罪 率 的 个 人 层 


T 在 这 个 例子 中 ， 包 括 了 第 二 年 的 阐 汇 攻 增 长 ， 违 反 了 将 年 龄 以 初始 年 龄 为 12 个 月 对 中 时 的 建 
议 ， 在 那里 ， 我 们 很 有 理论 上 的 理由 相信 ru 和 wii 两 者 均 为 0。 这 使 得 我 们 可 以 设 属 一 个 能 较 
好 拟 合 数据 的 简约 各 弄 ; 同时 ， 在 给 定 一 个 小 样本 时 ， 简 约 本 身 就 是 一 个 关键 的 考虑 因素 。 





174 ”分 层 线性 模型 : MASRANA 


次 效应 有 关 ， 除 非 加 以 考虑 ， 和 否则 就 会 使 层 - 1 系数 的 估计 有 偏 。Horney 等 
人 按 每 人 将 所 有 随时 间 变 化 的 协 变量 都 对 中 了 ， 从 而 保证 了 层 -1 自 变量 与 
结果 之 间 的 关系 估计 是 无 偏 的 - 同时 ， 他 们 还 将 平均 犯罪 率 作 为 平均 就 业 时 
间 比 例 和 平均 与 配偶 同 住 时 间 比 例 的 函数 ， 对 所 有 对 象 之 间 的 差异 进行 了 寞 
型 分 析 。 


增长 参数 的 方差 估计 


在 第 5 章 ， 我 们 曾 讨论 了 对 中 是 如 何 影 响 随机 系数 的 方差 估计 的 ( 见 
“估计 层 - 1 系数 的 方差 " ) 。 在 研究 个 体 变化 的 增长 模型 中 我 们 也 沿用 同样 的 
思路 。 如 果 时 间 序 列 研究 将 所 有 案例 设计 为 相同 的 ( 除 随机 的 缺失 数据 以 
外 )， 那 么 层 -1 自 变 量 如 年 龄 或 者 时 间 的 平均 数 就 不 会 发 生变 化 。 在 这 种 情 
况 下 ， 对 中 选择 并 不 会 影响 增长 率 的 方差 估计 。 然 而 ， 在 一 些 研究 中 ， 时 间 序 
列 设计 要 假设 案例 之 间 有 系统 性 变化 。 特 别 是 ， 当 被 调查 者 是 随 其 平均 年 龄 而 
变化 时 ， 将 个 人 以 其 平均 数 对 中 对 避免 偏差 就 非常 有 用 了 。 

我 们 来 看 全 国 青 年 调查 中 的 7 个 出 生 队 列 的 数据 (Miyazaki & Raunden- 
bush, 2000) 。 祥 本 的 调查 对 象 是 在 1976 年 时 年 龄 为 11 ~17 SADA, ATE 
1976 年 开始 每 年 被 调查 一 次 ， 共 延续 了 5 年 ， 到 1980 年 调查 时 他 们 的 年 龄 分 
济 为 15，…，21 岁 。 结 果 变 量 是 关于 反 社 会 态度 的 一 个 指标 。 图 6. 3 展示 了 
拟 合 的 二 次 变化 曲线 ,了 我 们 的 研究 兴趣 在 于 : 每 个 年 份 所 有 对 象 在 反 社会 态 
度 上 的 平均 变化 率 ， 以 及 不 同 对 象 在 变化 率 上 的 差异 。 尽 管 图 6.3 中 的 曲线 是 
二 次 曲线 ， 但 我 们 仅 考察 线性 的 变化 率 。 表 6. 10 中 提供 的 结果 是 按 不 同 对 中 
方式 估计 的 : (a) 以 总 的 年 龄 中 位 数 16 岁 来 对 中 ， 对 比 (b) 以 不 同 队列 中 
的 年 龄 中 位 数 来 对 中 (队列 1 -7 分 别 为 13，…，19 岁 )。( 除 缺失 值 外 ， 以 
队列 中 位 数 对 中 与 按 个 人 的 平均 数 对 中 是 等 价 的 ， 而 这 便于 对 本 例 进行 解 
F.) 注意 ， 以 队列 中 位 数 对 中 所 估计 的 线性 变化 率 的 方差 ， 约 为 以 总 的 中 位 
数 对 中 得 到 的 估计 结果 的 两 倍 ,< 那么 ， 到 底 包 一 种 估计 更 准确 呢 ? 


中 ”我们 感谢 《心理 学 方法 》 人 允许 我 们 复制 了 图 6.3， 它 出 于 Miyazaki 和 Raudenbush (2000) 的 论 
x 

BR PA He AC MR P aT AA HP H, EHTE 1, it 
于 解释 。 它 与 对 本 数据 采用 平均 数 中 的 整数 部 分 值 来 对 中 的 结果 基本 相间 。 
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图 6.3 实 线 分 别 为 7 个 出 生 队 列 的 二 次 有 曲线 ， 虚 线 是 平均 曲线 
R610 不 同 对 中 方法 对 线性 变化 率 方差 估计 的 影响 
方 法 EE 估计 值 SREB se 
(a) 以 总 的 中 位 数 对 中 0.00122 0. 00015 
(b) 以 队列 中 位 数 对 中 0. 00269 0, 00022 
(c) 稳健 的 一 致 性 估计 量 0. 00269 0. 00022 


为 了 检验 这 些 估计 的 有 效 性 ， 我 们 将 它们 与 稳健 的 一 致 性 估计 进行 比较 ， 
后 者 在 应 用 最 大 似 然 估 计 中 并 没有 用 到 有 关 截 距 的 信息 。 在 本 研究 中 ， 这 种 估 
计 是 对 所 有 576 位 被 调查 者 的 7 的 无 偏 估 计 值 的 加 权 平均 数 ， 即 : 


本 
WT Æ 
Rh, aIt i TO HAY OLS 斜率 估计 ，w, 是 这 一 估计 的 抽样 方差 ，A， 
是 这 种 估计 的 可 靠 性 ，Bo 是 总 平均 斜率 的 估计 。 上 述 结果 表明 ， 这 个 稳健 估 


计 与 按 队 列 中 位 数 对 中 的 估计 在 三 位 有 效 小 数 上 都 是 相同 的 。 与 按 总 的 中 位 数 
对 中 不 同 ， 通 过 以 队列 中 位 数 对 中 已 避免 了 由 于 7 个 队列 的 平均 年 龄 的 系统 性 
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变化 所 导致 的 估计 偏差 。 其 中 的 原因 与 第 5 章 中 所 讨论 的 问题 是 相同 的 ( 见 
“估计 层 -1 系数 的 方差 ") 


比较 分 层 模 型 、 多 元 重复 测量 模型 和 
结构 方程 模型 


本 章 所 讨论 的 增长 模型 中 的 分 层 方法 在 文献 中 以 不 同 的 名 词 出 现 ， 包括，: 
随机 效应 模型 (Laird & Ware, 1982) ， 混 合 线性 模型 (Diggle, Liang, & Zeger, 
1994; Goldstein，1995 ) ， 随 机 系数 模型 (Longford，1993) ， 以 及 分 层 线 性 模型 
(Strenio et al. , 1983; Bryk & Raudenbush, 1987) 或 简称 “HLM"。 我 们 下 面 
要 讨论 的 是 ， 这 种 方法 与 其 他 方法 之 间 的 关系 ， 如 多 元 重复 测量 (multivariate 
repeated-measures, MRM) 的 方差 分 析 和 结构 方程 模型 (SEM), 


多 元 重复 测量 模型 


分 层 线性 模型 和 多 元 重复 测量 模型 的 主要 差异 是 对 个 体 变化 建 模 的 概念 基 
础 不 同 。 分 层 线性 模型 的 层 - 1 模型 明确 地 将 每 个 个 体 的 变化 罗 迹 作为 个 人 特 
定 参 数 加 上 随机 误差 的 函数 . 层 -2 模型 描述 了 这 批 人 各 自 增长 参数 的 变化 ， 
与 之 形成 对 照 ， 多 元 重复 测量 (MRM) 方法 则 需要 : (a) 设置 主 效应 与 交互 
效应 ， 以 便 描 述 不 同 子 群 或 各 类 个 体 的 期 望 轨迹 ; (b) 设置 不 同时 间 上 重复 
测量 的 方差 与 协 方差 。 

第 二 个 不 同 点 在 于 某 一 数据 的 方法 适用 性 问题 。 传 统 的 MRM 要 求 每 个 
被 访 者 都 有 一 个 固定 的 时 间 序 列 设计 ， 即 所 有 人 被 调查 的 时 点 的 次 数 和 间隔 
完全 相同 。 相 反 ， 分 层 模型 在 这 方面 对 数据 的 要 求 就 更 为 灵活 ， 因 为 重复 观 
KAR AREF TA, MER MRM 那样 被 视 为 所 有 调查 者 都 是 相同 的 固定 
系列 。 因 此 ， 每 个 被 访 者 的 观察 次 数 和 时 间 可 以 是 随机 变化 的 。 层 - 1 自 变 
ft (包括 时 间或 年 龄 ) 可 以 是 连续 的 ， 并 允许 每 个 样本 案例 可 以 有 不 同 的 
分 布 。 

第 三 ， 在 分 层 模型 中 ， 建 立 个体 变 化 模型 可 以 让 我 们 自然 地 研究 外 部 情景 
如 社区 或 组 织 是 如 何 随 着 时 间 影响 个 人 发 展 的 。 模 型 的 层 - 3 可 以 用 来 表示 这 
种 情景 的 变化 ( 匈 第 8 意 )。 而 标准 框架 的 MRM 要 想 扩展 为 这 种 有 效 估计 是 
非常 困难 的 ， 甚 至 是 不 可 能 的 。 
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结构 方程 模型 (SEM) 


另外 一 种 正 逐 步 推广 的 方法 是 结构 方程 模型 (SEM) ， 应 用 软件 主要 有 
LISREL ( Joreskog & Sorbom, 1989), M-plus ( Muthén and Muthén, 1998), 或 
者 是 EQS ( Bentler, 1995 )。 在 McArdle (1986) 以 及 Meridith 和 Tisak 
(1990) KEHEL, Wilen 和 Sayer (1994) 已 经 证 明 ， 有 一 部 分 两 层 增长 
模型 也 可 以 在 结构 方程 模型 的 框架 内 进行 估计 。 结 构 方程 模型 中 的 测量 模型 对 
应 于 分 层 分 析 中 的 层 - ! 模型 ， 结 构 方程 模型 中 的 潜在 变量 就 是 分 层 模型 中 的 
个 人 增长 参数 。 因 此 ， 结 构 方程 模型 中 的 结构 模型 就 对 应 于 分 层 分 析 中 的 层 -2 
模型 ， 或 称 “ 人 际 模型 ” (between-person model) Willett 和 Sayer 提出 的 这 种 
重新 构建 的 好 处 在 于 : 一 旦 这 个 模型 转变 为 结构 方程 模型 框架 ， 就 可 以 利用 结 
构 方程 模型 软件 中 的 所 有 协 方差 结构 分 析 。 它 们 包括 自 相 关 的 层 -1 随机 效应 
和 异 质 性 的 层 -1 随机 效应 。 利 用 结构 方程 模型 ， 可 以 检验 各 式 各 样 的 协 方差 
结构 。 但 这 种 方法 的 一 个 缺点 是 ， 它 要 求 各 个 子 类 必须 具有 平衡 的 “时 间 结 
构 ” (time-strictured) 数据 。 也 就 是 说 ， 像 MRM 一 样 ， 每 个 被 访 者 都 必须 具 
有 相同 的 被 访 次 数 和 间隔 ， 并 且 子 类 中 所 有 案例 的 、 具 有 随机 效应 的 层 - 1 自 
变量 都 必须 具有 相同 的 分 布 .相反 ， 分 层 模 型 则 允许 案例 被 访 的 次 数 和 空间 
可 以 不 同 ， 而 且 包 含 随机 效应 的 层 ~ 1 自 变量 对 于 不 同 的 人 可 以 有 不 同 的 

因此 ， 看 起 来 研究 者 不 得 不 在 分 层 模型 和 结构 方程 模型 之 间 做 出 选择 。 分 
层 模 型 允许 使 用 不 同 的 数据 结构 和 层 - 1 模型 ， 但 协 变量 结构 的 选择 很 少 ; 而 
结构 方程 模型 允许 多 种 协 方差 结构 ， 但 不 够 灵活 ， 无 法 把 握 不 平衡 的 研究 设 
计 。 然 而 ， 更 准确 地 说 ， 目 前 这 种 被 迫 的 选择 反映 的 是 当前 软件 能 力 上 的 限 
制 ， 而 并 不 是 在 模型 方法 能 力 上 的 限制 。 

心理 学 研究 常常 忽略 了 Jennrich 和 Schlucter (1986) 的 重要 研究 ,有 他 们 


1 对 这 些 方法 南 言 ,“ 协 方 莽 结 构 模型 ”也 许 比 “结构 方程 重型” 描述 得 更 准确 ， 办 为 这 种 模 浇 
是 通过 对 多 元 正 态 分 布 的 协 方差 矩阵 加 以 某 种 约束 来 推导 的 。 然 而 ， 这 里 我 们 仍 沿用 普遍 应 用 
的 名 称 “ 结 构 方程 模型 " 

”有 此 结构 方程 模型 的 软件 安 求 数据 其 有 时间 结构 设计 ， 但 允许 有 随机 缺失 数据 。 

o 这 个 结果 已 经 被 包括 在 RMDP 的 Program Svih F, CEE) SPSS 和 SAS 等 统计 分 析 元件 最 新 发 
We AY) Be 
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研制 了 -种 更 灵活 的 方法 ， 可 以 分 析 服从 于 多 元 正 态 分 布 的 时 间 序 列 数据 。 这 
种 方法 与 SEM 的 类 似 之 处 是 ， 可 以 估计 多 种 类 型 的 协 变量 结构 ， 比 如 : 与 分 
层 模 型 或 自 相 关 模 型 中 一 样 的 “随机 效应 ”的 协 方差 结构 ， 层 - 1 异 分 布 的 方 
差 模 型 ， 以 及 带 有 因子 分 析 结构 的 模型 。 像 结构 方程 模型 一 样 ， 他 们 假定 设计 
是 按 “ 时 间 结 构 ” 的 〈 即 每 个 案例 调查 时 点 之 间 的 人 间隔 不 变 ) ， 但 是 它 允 许 时 
间 序 列 数据 中 存在 随机 缺失 。 这 种 方法 在 生物 医学 研究 中 很 流行 ， 它 将 两 个 优 
点 结合 起 来 ， 既 允许 缺失 数据 ， 又 允许 多 种 协 方差 结构 。 后 来 ，Thum (1997) 
将 这 种 方法 扩展 为 三 层 的 模型 ( 匈 第 8 E), 这 种 由 Jennrich 和 Schlucter 研制 
的 方法 既 可 以 应 用 于 分 层 模 型 的 框架 中 ， 也 可 以 应 用 于 结构 方程 模型 的 杠 
架 中 。 

为 了 更 清楚 地 理解 多 元 重复 测量 、 结 构 方程 模型 和 分 层 线性 模型 之 间 的 相 
似 和 差异 之 处 ， 考 察 以 下 三 种 类 型 的 数据 是 重要 的 : (1) 观察 数据 是 半 衡 的 ; 
(2) 完整 数据 是 平衡 的 ， 但 在 某 些 时 点 上 有 随机 缺失 ， 因 此 每 个 人 的 时 点 次 
数 有 所 不 同 ; (3) 完整 数据 是 不 平衡 的 ， 比 如 当 个 人 之 间 的 层 -1 自 变量 有 不 
同 分 布 时 的 情况 。 

假设 在 时 间 :+ 上 对 第 i 个 人 有 结果 变量 Y,， 他 总 共 被 观察 了 了 次 (t=1，…， 
7,) ， 我 们 可 以 建立 简单 的 层 - 1 线性 模型 : 


Y= mo + Tiau tes, el ~ N(0,o) [6.22] 


其 中 ，a, 是 第 i 个 人 在 时 间 + 上 的 年 龄 。 为 了 简单 起 见 ， 在 层 -2， 我 们 用 无 条 
件 模 型 : 
To = Pw + Uo, 


7, = By + ty 


(MO 而 


[6.23] 


其 组 合 方程 为 : 
Ya = Boo + Bots + es [6. 24] 
其 中 : 
En = My, tua, +e, 


Var(es) = 5, = 7m+2a7 + alr +o" 
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[6.25] 


Cov( EnEn) = Êu, = Tm + Cay + ay) Ty + eA iT 


例 1: 观察 数据 是 平衡 的 


假设 每 个 人 都 有 7 个 观 浏 值 ( 即 所 有 的 i 有 7,=7T)， 由 此 ， 对 于 第 i 个 人 
的 结果 变量 7 就 服从 于 7 维 多 元 正 态 分 布 ， 在 时 间 EHDA ôn, Ent 
和 4 的 观察 值 之 间 的 协 方差 为 6,.;。 再 进一步 假设 ， 对 于 所 有 被 调查 者 ， 他 们 
在 时 间 上 上 上 的 年 龄 是 完全 相同 的 〈 即 每 个 人 都 是 在 每 年 生日 的 时 候 被 调查 ， 而 
且 在 研究 开始 时 他 们 的 年 龄 也 是 一 样 的 ) ,了 因此 ， 对 于 每 个 人 都 有 a, = a,。 在 
这 种 情况 下 ， 这 批 数据 就 服从 于 离散 一 致 性 的 假设 ， 即 对 于 所 有 的 上 有 品 = 有 
和 6 =6( 即 用 a, EAB 6.25 中 的 a,)。 总 而 言 之 ， 每 个 人 的 数据 都 服从 
于 了 元 正 态 分 布 ， 具 有 共同 的 方差 协 方差 矩阵 ， 其 中 方差 为 8， 协 方差 为 8。 。 
原则 上 ， 这 个 共同 的 协 方差 矩阵 内 有 TT + 1)72 个 参数 ， 包 括 7 个 方差 (对 
应 每 个 时 点 ) 和 了 (CT- 1)72 个 协 方差 (对 应 每 一 对 时 点 )。 例 如 在 下 面 的 例子 
h, 7=5， 那 么 这 个 矩阵 中 就 有 5 个 方差 和 10 个 协 方差 。 然 而 ， 在 方程 6. 22 
和 6.23 这 样 的 两 层 模 型 中 ， 这 些 方差 和 协 方差 是 4 个 参数 (Tos Tos Ts 
o’) 的 函数 。 因 此 ， 在 这 种 情况 下 ， 对 应 于 像 方程 6. 25 那样 更 一 般 地 规定 有 
7(7+1)72 个 协 方差 参数 的 了 维 正 态 分 布 来 说 ， 方 程 6. 22 和 6. 23 所 表示 的 分 
层 模型 仅 是 一 个 特殊 情况 。 因 此 ， 方 程 6. 22 和 6. 23 所 表示 的 分 层 线性 模型 可 
以 视 为 特殊 的 “ 协 方差 结构 ”模型 。 标 准 的 结构 方程 模型 软件 可 以 估计 这 种 
模型 ， 并 且 可 以 估计 其 他 类 型 的 协 方差 结构 ( 比如 自 相 关 的 层 - 1 残 差 以 及 那 
种 在 不 同时 点 上 有 不 同方 差 的 层 - 1 残 差 ) 。 


例 2: 完整 数据 是 平衡 的 


现在 假设 ,研究 目的 是 对 每 个 人 收集 7 个 观测 值 ， 但 所 收集 的 数据 中 有 随 
机 缺失 ， BWA, 第 i 个 人 可 能 只 有 7; RWA, HPT ST ME, HFH i 
个 人 的 数据 服从 T 维 正 态 分 布 ， 即 每 个 人 的 数据 所 服从 的 分 布 是 不 同 的 。 由 
于 标准 的 多 元 重复 测量 分 析 方法 要 求 每 个 子 类 中 的 案例 都 具有 相 僻 的 协 方差 矩 


中 当然， 每 一 个 人 都 在 相同 的 确切 年 龊 上 被 调查 不 是 真 的 ， 但 它 间 以 近似 是 真 的 。 
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阵 ， 所 以 这 种 方法 存 这 里 是 不 适用 的 。 因 此 ， 方程 6. 22 和 6. 23 所 表示 的 分 层 
线性 模型 就 不 能 再 被 视 为 7 维 正 态 分 布 的 一 种 特殊 情况 了 。 

但 是 ,我们 可 以 解决 这 个 问题 ， 其 方法 是 设 一 个 变量 了 ,t=1,，…,7， 
作为 “完整 数据 "， 也 就 是 我 们 希望 收集 的 数据 ， 而 了;,，r = 1，…，R,， 是 实 
际 观测 数据 “的 一 个 子 集 。 于 是 ， 方 程 6. 22 和 6. 23 所 构成 的 分 层 模型 就 是 了 
维 正 态 分 布 模型 的 一 个 特例 。 根 据 Joreskog 和 Sorbom (199%6) 以 及 Goldstein 
(1995) 的 研究 结果 ， 我 们 可 以 建立 一 个 新 的 层 - 1 模型 来 描述 缺失 数据 的 
Hist: 


(d 
¥, = 了 ma [6.26] 
4 


其 中 ， 当 7 在 时 间 :得 到 观测 时 ，m 取 值 为 1; 否则 为 0。 例 如 ， 在 全 国 青年 
调查 (NYS) 中 有 一 个 被 访 者 i 在 时 点 2 和 4 上 得 到 观测 ， 但 在 时 点 1、3、5 
上 却 没 有 被 观测 。 因 此 ， 第 i 个 人 的 第 一 个 观测 值 就 处 于 :+=2 时 ， 而 他 的 第 二 
次 观测 值 则 处 于 +=4 时 ,或 者 用 方程 表示 前 者 为 : 


Yua mY + may Yt my Yy + mK + ms Yg 
= (0) xY + (1) xY + (0) x WY + (0) xY +(0) xY; [6. 27} 
= Yy 


同 理 , 第 i 个 人 的 第 二 次 观测 值 是 在 时 间 t=4 时 : 


Y= (0) x Y} + (0) x Ys + (0) x Ys + (1) x Ye +(0) xY; 


-ks 


用 分 层 线性 模型 的 术语 ， 各 m,, 都 是 层 -1 自 变量 ， 而 完整 数据 YS. Yi, Yi, 
Yi. Yo 则 是 层 -1 的 系数 . 在 这 里 ， 层 -1 没有 随机 效应 。 

然后 ， 在 层 -2 模型 中 设 潜在 变量 Y 为 结果 变量 ， 这 相当 于 方程 6.24。 
第 14 章 讨论 对 这 种 特殊 情况 的 分 是 线性 模型 的 估计 理论 。 

建立 其 他 协 方差 结构 的 模型 。 下 面 我 们 将 用 全 国 青年 调查 (NYS) 中 第 一 
个 出 生 队 列 的 数据 为 例 ， 来 阐述 几 种 不 同 的 增长 模型 分 析 。 有 关 该 调查 的 情况 
请 参见 (Elliot, Huizinga, & Menard ，1989) 。 调 查 目 的 是 对 第 一 个 队列 的 所 
有 239 名 对 象 在 其 年 龄 为 11 12,13, 14, 15 岁 时 对 其 进行 调查 访问 ， 因 此 ， 
这 里 7=5。 事 实 上 ， 其 中 在 5 个 时 点 有 完整 观测 值 的 对 象 共有 168 人 ， 而 有 
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45 人 只 有 4 个 时 点 数据 ，14 人 只 有 3 个 时 点 数据 ，5 人 仅 有 2 个 时 点 数据 ， 而 
其 余 7 人 则 只 有 1 个 时 点 数据 

全 国 青年 调查 的 主要 日 的 是 了 解 青年 人 反 社 会 的 态度 和 行为 。 在 这 里 ， 我 
们 仅 关注 他 们 对 越轨 行为 的 态度 ， 通 过 每 年 调查 ， 它 可 以 被 近似 地 视 为 一 个 连 
续 变 最，Coufredson 和 Hirschi (1990) 关于 犯罪 的 一 般 理 论 巴 言 ， 在 青少年 时 
期 阶段 (11 ~ 15 岁 ) ， 反 社会 行为 随 年 龄 而 线性 增长 。 作 为 这 种 理论 的 合理 推 
论 ， 本 例 中 所 关注 的 结果 变量 ， 即 青少年 对 越轨 思想 的 容忍 度 ， 也 可 以 假设 为 
线性 增长 。 因 此 ， 我 们 就 可 以 对 完整 数据 7 建立 一 个 模型 ， 


Yo = Wo + m4, +e, [6.28] 


其 中 : 
六 FES i ThA CEM TA :时 的 容忍 度 ; 
a, 是 在 时 间 上 时 的 年 龄 减 去 13; 因此 有 
Tw 表示 第 i 个 人 在 13 岁 时 的 期 望 容 忍 度 ; 
Ti 表示 存 11 ~ 15 岁 之 间 容 忍 度 的 年 增长 率 ; 
© TEP ARR 


以 下 我 们 提供 了 一 系列 由 易 而 难 的 模型 结果 。 

(C1) 复合 对 称 (compound symmetry) 模型 。 单 变量 重复 测量 的 方差 分 析 
假定 有 一 个 共同 的 协 方差 结构 ， 这 要 求 在 不 同时 点 上 方差 相同 ， 而 且 还 要 求 所 
有 的 协 方差 也 相同 。 这 就 相当 于 假定 : (a) 层 -1 随机 效应 。, 是 独立 的 ， 而 且 
有 同 质 的 层 -1 Ho; (b) 所 有 个 人 都 有 相同 的 线性 斜率 。 在 这 种 复合 对 
称 模型 中 ， 方 程 6. 23 中 的 层 -2 窜 型 可 以 简化 为 : 


[6.29] 
Ti = By 
那么 其 组 合 模型 就 是 将 方程 6. 24 和 6. 25 中 的 ri, 和 ru 设 为 0 的 特例 ; 
Eu = Uy tey 
Varle,) = 6 = 7m to [6.30] 


Cov( Eun) = by = Te 


于 是 ,复合 对 称 模型 将 调查 数据 中 在 T=5 个 时 点 上 的 15 个 方差 协 方差 参数 作 





182 Á 分 层 线性 模型 : 应 用 与 数据 分 析 方 法 


为 仪 有 了 两 个 潜在 参数 Cry Bo”) 的 函数 来 表达 。 
Cl) -AEII (first-order-autoregressive) 或 称 AR(1) 模型 。 这 个 模型 


就 是 在 方程 6. 30 所 示 的 复合 对 称 模型 中 再 加 入 一 个 自 相关 项 ， 即 ; 


see ite [6.31] 
by = Tw» top 

于 是 ， 这 个 模型 将 全 国 青年 调查 数据 中 的 15 个 可 能 的 方差 协 方差 作为 3 个 潜 

在 参数 (Tw. pHo) HAYO Rik, 

CW) 随机 斜率 ， 则 质 性 层 -上 方差 。 这 是 广 为 应 用 的 分 层 线性 模型 ， 即 
方程 6.22 和 6.23。 它 用 4 个 潜在 参数 (To. To THs o°) 的 函数 来 表达 这 
IS 个 方差 协 方差 参数 。 

CW) 随机 斜率 ， 异 质 性 层 -1 方差 。 这 一 模型 将 方程 6.22 和 6.23 进 一 
步 改进 ， 使 之 允许 在 各 时 点 上 有 不 同 的 方差 。 因 此 ，15 个 方差 协 方差 参数 在 
这 里 表达 为 8 个 法 在 参数 (Ta, Tas Ty Ol, ol 03, 01, oF) 的 函数 。 另 
一 种 最 简约 的 对 层 - ! 模型 中 异 方差 性 模型 的 设置 就 是 将 方差 的 对 数 表示 为 年 
A PR, fA MU: 


info?) = ae + a,a, [6.32] 


用 线性 模型 表示 方差 对 数 的 理论 依据 曾 在 第 5 竟 “ 层 -1 方差 异 质 性 情况 下 的 
应 用 ”中 予以 了 讨论 。 

(V) 无 约束 (unrestricted) 模型 。 在 这 种 模型 中 ， 有 一 个 Tx1 阶 的 误差 
向 量 ， 服 从 于 以 均值 为 0、 通 用 方差 协 方差 矩阵 为 工 的 了 维 正 态 分 布 。 在 全 国 
青年 调查 研究 中 ， 无 约束 模型 需要 估计 15 个 独特 的 方差 协 方差 参数 。 注 意 ， 
随 着 了 的 增 大 ， 这 个 模型 会 变 得 异常 复杂 。 例 如 ， 一 个 有 20 个 时 点 的 无 约束 
模型 将 会 有 210 个 方差 协 方差 参数 。 但 是 ， 如 果 了 较 小 ， 这 个 模型 就 可 以 作为 

合 程度 的 标准 来 检测 那些 较 简 单 的 子 模型 。 

结果 : 层 -2 系数 。 表 6.11 给 出 了 5 个 模型 的 估计 值 和 拟 合 统计 指标 。 比 
较 这 5 套 估 计 值 ， 总 的 截 距 B。(13 岁 时 的 期 望 结果 ) 都 非常 接近 (0.321 ~ 
0.328 之 间 ) ， 而 且 相应 的 标准 误 也 基本 相同 (都 在 0.013 左右 ) 。 平 均 增长 率 
的 估计 值 Bo 也 都 非常 相似 。 然 而 ， 复 合 对 称 模 型 所 得 的 标准 误 估计 却 小 于 其 
他 方法 的 结果 。 一 般 来 说 ， 本 例 对 层 -2 固定 系数 的 推断 与 模型 协 方差 结构 的 
选择 应 该 是 没有 太 大 关系 的 ， 只 有 一 个 例外 ， 从 误差 的 角度 考虑 ， 复 合 对 称 模 
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型 将 会 低估 平均 增长 率 的 不 确定 性 ( 表 6. 11 并 没有 列 出 对 数 线性 模型 的 结果 ， 
因为 发 现年 龄 与 层 -1 方差 之 间 无 关 ) 

结果 ; 模型 拟 合 。 一 般 而 言 ， 我 们 总 是 寻找 最 为 简约 而 又 能 够 充分 说 明 数 
据 的 模型 ( 见 表 6. 12)。 毫 不 奇怪 ， 无 约束 模型 即 分 别 对 17 个 参数 (5 个 方 
差 、10 个 协 方差 以 及 2 个 层 -2 固定 系数 ) 做 出 估计 的 模型 ， 比 其 他 较 简单 的 
模型 有 更 好 的 拟 合 度 。 注 意 ， 该 模型 的 偏差 度 为 - 378. 26。 在 其 余 的 模型 中 ， 
最 为 复杂 的 就 是 层 -1 随时 间 有 异 方差 性 的 随机 斜率 模型 (总 共有 10 FSH), 
其 模型 的 偏差 度 为 - 348.57， 上 述 两 种 模型 的 偏差 度 差异 为 -348.57 - 
(一 378.26) = 29.68 ， 与 自由 度 为 17 -10 =7 的 x* 分 布 的 百 分 位 值 相 比 较 ， 
有 p<0.001， 表 明 必 须 拒绝 较 简单 的 模型 。 这 当然 是 可 能 的 ， 因 为 更 复杂 的 增 
长 模型 将 会 有 更 充分 的 拟 合 度 ， 如 本 例 加 入 了 随机 变化 的 线性 与 二 次 的 斜率 。 


表 6.12 比较 不 同 模型 之 间 的 偏差 度 统计 量 











(a) 模型 概述 WÉR Deviance 自由 度 df 
CD POLAR MAE Ct 1 a -229 00 o> 
(2) 随机 截 距 模型 AR (1) ( 层 -1 WRAMR) ~ 294. 32 5 
(3) PAOLA (JZ - 1 同 质 方差 } ~338.07 6 
(4) 随机 斜率 模型 ( 层 -1 方 若 在 各 时 点 上 不 同 ) -348. 57 10 
(5) 随机 斜率 模 卉 (J -1 方 荐 为 对 数 线性 模型 ) -347.71 8 
(6) 无 约 束 模 型 -378.26 17 
Cb) 有 选择 的 异型 对 比 tha 38 SEE 自由 度 af P 
am 对 比 模型 3 J 109.07 2 . 000 
模型 3 对 比 模 避 4 10.51 4 .032 
模型 5 对 比 模型 4 0.87 2 一 
BEN 4 对 比 模型 6 29. 68 7 -000 





拟 合 最 不 好 的 模型 是 复合 对 称 模型 ， 所 得 的 偏差 度 是 - 229. 00， 有 4 个 自 
由 度 。 如 果 其 再 加 入 一 个 参数 〈 自 相关 参数 ) ， 那 么 偏差 度 减少 为 - 294.32 - 
( - 229.00) = 65.32 。 自 相关 的 估计 值 为 0. 40。 如 果 在 复合 对 称 模型 中 再 加 
入 两 个 参数 ( 即 自 相 关 参 数 和 随机 斜率 参数 ) ， 随 机 斜率 也 使 模型 拟 合 度 继 续 
大 幅度 改善 (注意 ， 其 偏差 度 为 - 338. 07) 。 显 然 ， 该 模型 又 比 AR(1) 要 好 
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得 多 ， 如 果 再 允许 层 -1 方差 在 每 个 时 点 上 不 同 ， 那 么 随机 斜率 模型 又 使 偏差 
度 略 减少 到 -348. 57， 我 们 注意 到 ， 这 套数 据 不 可 能 同时 既 人 允许 估计 自 相 关 参 
数 义 允许 斜率 随机 变化 -我 们 怀疑 要 同时 估计 这 两 个 参数 就 需要 更 多 的 时 点 
数据 

ER: 拟 合 的 方差 和 相关 比较 偏差 度 统计 值 是 比较 模型 好 坏 的 一 种 经 验 
方法 ， 另 一 种 对 各 种 不 同 模型 更 有 实际 意义 的 度量 方法 是 ， 以 无 约束 模型 所 反 
映 的 方差 与 相关 为 标准 ， 评 价 不 同 模型 对 这 种 基本 结构 的 再 现 能 力 。 这 是 可 能 
做 到 的 ， 但 有 个 条 件 ， 就 是 时 点 数 必须 足够 小 ， 以 确保 无 约束 模型 估计 的 稳定 
性 。 这 正如 我 们 当前 例子 的 情况 ， 时 点 数 了 =5， 而 案例 数 为 239 人 。 表 6. 13 
列 出 了 5 个 时 点 上 的 拟 合 方差 和 协 方差 。 

在 无 约束 模型 中 方差 协 方差 结构 具有 二 个 关键 特征 : 第 一 ， 方 差 随 年 龄 增 
长 而 增加 : 注意 ， 当 年 龄 从 11 岁 到 15 岁 之 间 增 加 时 ， 估 计 值 为 0.035、 
0.045, 0.073, 0.086, 0.090, 第 二 ， 相 邻 两 个 时 点 的 相关 性 也 随 着 年 龄 逐步 
增强 ， 这 表明 “态度 明朗 化 ” (参见 表 6. 13 底部 最 后 相关 矩阵 中 对 角 线 上 边 
的 相关 系数 0.42、0.49、0.67、0.76) 。 第 三 ， 相 邻 两 个 时 点 的 相关 性 比 其 他 
任意 两 个 时 点 上 的 相关 性 要 强 ， 例 如 第 5 个 时 点 与 其 他 较 早 时 点 上 的 相关 性 分 
别 为 0.76、0.59、0.43、0.44。 假 定 这 组 数据 中 有 一 个 核心 的 协 方差 结构 特 
fE. 那么 我 们 的 问题 是 : 其 他 较 简 单 的 模型 到 底 在 多 大 程度 上 能 够 表现 出 这 三 
个 基本 的 特征 ? 

复合 对 称 模 型 在 这 方面 做 得 很 差 。 在 这 个 模型 中 ,方差 并 没有 随 年 龄 而 增 
长 ， 而 是 被 限制 为 一 个 常数 0.066， 相关 性 也 没有 随 年 龄 增加 或 者 随 上 距离 而 减 
少 ， 也 都 被 固定 为 一 个 常数 0. 51。 

自 回 归 模 型 稍微 好 一 点 ， 相 关 性 随 着 时 点 间 的 距离 而 逐步 碱 小 (15 岁 时 
的 残 差 和 其 他 更 小 年 龄 时 的 残 差 之 间 的 相关 分 别 为 0.62、0.47、0.41、 
0.38)。 然 而 ， 所 得 模型 中 的 方差 并 没有 随时 间 而 变化 ， 而 卫 相 邻 两 个 时 点 上 
的 相关 性 也 均 为 常数 。 

层 -1 ( 同 质 方 差 的 ) 随机 斜率 模型 比 前 两 个 模型 要 好 得 多 ， 能 够 再 现 协 
方差 结构 的 关键 特征 ， 注意， 方差 估计 随 年 龄 而 逐步 增 大 (0.040、0.048 、 
0.061, 0.079, 0.102); 相 邻 两 个 时 点 的 相关 性 也 随 年 龄 而 增 大 (0.37、 
0.49、0.61、0.70) ， 而 且 也 随 着 两 时 点 间 的 距离 而 减少 (如 15 岁 和 更 小 年 龄 


DO 应 用 费 会 乐得 分 算法 【Fisher scoring algorithm) 的 党 试 得 出 了 负 的 斜率 方差 估计 。 
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之 间 的 残 差 相关 分 别 为 0.70、0.63、0.53、0.38)。， 

将 无 约束 模型 表示 为 个 体 变化 的 多 项 式 模型 。 对 于 时 间 结 构 的 数据 ， 总 是 
可 以 用 一 个 “标准 ”的 分 层 线性 模型 (比如 个 体 变 化 的 多 项 式 模型 ) 完美 地 
骨 现 无 约束 模型 的 结果 .具体 而 言 ， 如 果 层 -1 模型 为 了 -2 阶 的 多 项 式 且 所 
有 系数 是 随机 的 ， 击 且 层 -1 方差 可 以 随时 间 而 变化 ( 即 每 个 时 点 上 都 有 一 个 
WH). 那么 两 层 分 层 线性 模型 的 层 -2 AT (T+1)/2 个 协 方差 参数 ， 正 好 
可 以 表示 出 无 约束 模型 的 边际 方差 协 方差 估计 。 在 我 们 的 例子 中 ， 因 为 7=5， 
所 以 异 质 方差 的 随机 三 次 方 模型 就 可 以 再 现 无 条 件 模型 的 结果 。 

I -1 模型 为 ; 


Yi = a, + 7,0, + LL 志和 
[6.33] 

e, ~ N(0,.0}) 
这 里 ，c, 是 三 次 方 的 对 比值 (contrast), MH a, Ma? 为 自 变量 、a? 为 因 变 
其 回 归 所 得 的 残 差 。 给 定 a, 是 对 中 的 ， 这 种 方法 就 可 以 保证 三 个 多 项 式 部 分 
为 正 交 。 在 层 -2, 4 个 变化 参数 (Tu, mu, Tu. mu) 围绕 其 平均 值 变化 和 
协 变 。 因 此 ， 层 -2 的 方差 协 方差 矩阵 是 4 x4 的 和 矩阵， 有 10 个 参数 。 最 后 ， 
模型 的 层 -1 有 5 个 方差 o; ，!=1，…，5， 这 样 就 产生 了 全 部 15 个 方差 协 方 
HBR. 


BY 3, 完整 数据 是 不 平衡 的 


现在 假设 ,模型 包括 一 个 有 随机 效应 r,; 的 层 -1 自 变量 ou， 并 且 每 个 人 
都 有 一 套 不 同 的 o, 值 。 在 大 规模 的 调查 研究 中 ， 肯 定 会 由 于 多 种 原因 而 无 法 
严格 保证 各 次 观测 之 间 的 时 间 间 隔 。 例如， 许多 调查 对 象 难 以 找到 ， 或 者 对 象 
要 求 安排 其 他 访谈 时 间 ， 或 者 是 由 于 调查 费用 限制 了 调查 员 数 量 配置 上 的 灵活 
性 。 在 这 种 情况 下 ， 对 各 个 被 访 者 而 言 ， 年 龄 分 布 就 必然 存在 着 差异 。 事 实 
上 ， 也 不 会 有 两 个 对 象 在 时 间 上 上 有 完全 相同 的 年 龄 a,。 而 且 即 使 层 - 2 单位 
的 个 人 都 有 几乎 相同 的 年 龄 ， 层 -1 的 自 变 量 值 也 会 因 人 而 异 。 正 如 下 面 所 找 
述 的 ， 在 全 国 青年 调查 数据 中 ， 与 某 个 人 特征 相同 的 其 他 人 (peers) 的 反 社 
会 态度 就 是 模型 中 一 个 包含 了 随机 效应 并 随时 间 变 化 的 协 变量 ; 这 个 协 变量 的 
一 套 观 测 值 对 于 每 个 人 来 说 也 是 不 同 的 。 在 这 种 情况 下 ， 即 使 每 个 人 被 调查 的 
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次 数 都 是 常数 T7， 完 整数 据 也 不 能 被 看 成 是 平衡 的 。 因 此 ,方差 如 在 每 个 人 之 
间 都 是 连续 变化 的 ， 每 个 协 方差 可 ,也 是 这 样 。 这 种 方差 异 质 性 模型 就 不 能 用 
多 元 重复 测 指 或 者 结构 方程 模型 来 进行 估计 了 。 在 这 种 情况 下 ， 标 准 的 分 层 线 
性 模型 方法 就 不 能 被 看 成 是 一 个 简化 的 “无 约束 模型 ”。 事 实 上 ， 在 这 方面 ， 
分 层 线性 模型 就 显得 包容 性 更 强 了 ， 

例子 。 在 全 国 青 年 调查 数据 中 ， 在 每 一 时 点 我 们 对 被 访 者 都 建立 一 个 揭示 
(exposure) 指标 EXPO， 来 测量 有 多 少 个 特征 相同 且 能 够 容忍 越轨 行为 的 其 他 
人 (细节 请 参见 Raudenbush & Chan, 1993). XAH “EXPO” 的 变量 值 对 
于 不 同 对 象 是 随时 间 变 化 的 ,假设 现在 我 们 将 “EXPO” 定 义 为 分 层 线性 模型 
层 -1 中 的 一 个 自 变量 ， 即 所 谓 的 “随时 间 变 化 的 协 变量 ” (time-varying cova- 
riate) ， 那 么 ， 当 下 面 两 个 条 件 之 一 成 立时 ， 这 个 边际 方差 协 方差 矩阵 就 会 是 
异 方差 性 的 : 

1. EXPO 变量 有 一 个 随机 系数 ;或 者 

2. a, JETE EXPO 的 函数 
为 了 示范 ， 我 们 来 估计 一 个 “标准 的 ”两 层 模型 ， 其 中 层 - 1 模型 为 : 


Ya = mn + 7,0, + 3,0), + myl EXPO), +e, [6.34] 


同时 ， 层 -1 方差 仍然 保持 为 同 质 性 的 ao*。 在 层 -2， 所 有 的 系数 都 是 随机 
AY, Bp: 


Tu = Bo tu, p=0.1,2,3 [6.35] 


由 于 7 现在 是 4x4 的 矩阵 ， 因 此 层 -2 模型 有 10 个 方差 协 方差 参数 ， 而 整个 
模型 有 11 个 参数 。 我 们 将 这 个 模型 与 下 面 的 “无 约束 模型 ” 相 比 较 : 


Y? = Bo + Biot, + By; + By( EXPO), + 2, [6.36] 


这 个 模型 总 共有 15 个 方差 协 方差 参数 。 表 6. 14 列 出 了 模型 的 结果 。 注 意 ， 这 
两 个 模型 中 关于 固定 效应 的 推断 基本 相同 。 然 而 ， 建 立 在 11 个 方差 协 方差 参 
数 基础 上 的 分 层 线性 模型 的 偏差 度 实际 上 要 小 于 无 约束 模型 的 偏差 度 ， 其 中 后 
者 有 15 个 方差 协 方差 参数 (如 果 包 括 固定 效应 ， 总 共 就 有 19 个 参数 ) 。 这 里 ， 
尽 答 分 层 线性 模型 中 的 参数 少 了 几 个 ， 但 它 并 不 是 无 约束 多 元 重复 测量 模型 的 
子 模型 。 这 个 分 层 线性 模型 允许 在 各 被 访 者 中 具有 异 质 性 的 方差 协 方差 矩阵 ， 
并 将 其 作为 各 被 访 者 EXPO 变量 的 函数 ; 而 无 约束 模型 仅仅 是 就 假设 方差 协 方 
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差 算 阵 同 质 性 的 一 族 模 型 而 言 的 一 般 模型 。 在 这 种 情况 下 ， 无 约束 多 元 重复 测 
二 模型 就 不 能 表示 出 全 国 青年 调查 数据 中 的 一 个 关键 特征 。 


表 6.14 无 约束 多 元 重复 测量 模型 与 带 随 时 间 变 化 的 协 变量 的 











随机 效应 分 层 线性 模型 的 结果 比较 
无 约束 的 MRM HLM 模型 
侣 定 效应 系数 PENE iR se + 比 率 系数 标准 误 se 4 比率 
RH. Bw 0. 3252 0.0127 25. 56 0. 3251 0. 0125 25. 86 
HPE. Bio 0. 0487 0. 0045 10. 74 0. 0466 0. 0047 10. 00 
-次 , Pw -0.0006 0. 0030 -0.21 0, 0006 0. 0030 0.21 
EXPO, Bw 0, 3186 0. 0244 13.07 0. 3430 0.0295 11, 62 
方差 协 方差 成 分 
0.035 oon 0.014 0.015 0.014 0.0236 0.0034 -0.0016 0.0072 
0.035 0.018 0.016 0.016 0.0021 0.0000 - 0.0029 
~ 了 = 
== 0.054 0.034 0.028 0.0038 0.0000 
9.062 0.042 0, 0457 
0.06245 &=0. 0210 
异型 拟 合 情 况 
MICE Deviance ~ S17. 26 -522.47 
自由 度 df 19 15 





层 -1 中 缺失 观测 值 的 影响 


结合 最 大 似 然 估 计 ， 应 用 分 层 线性 模型 来 研究 增长 的 一 个 重要 优点 在于 : 
这 种 方法 具有 能 够 处 理 缺失 观测 值 的 灵活 性 。 与 传统 方法 不 同 ， 这 种 方法 可 以 
将 所 有 的 人 包括 进来 ， 只 要 每 个 人 至 少 有 一 次 观测 。 在 数据 缺失 是 随机 的 这 种 
假定 之 上 ， 对 分 析 结 果 的 解释 与 所 有 数据 都 没有 缺失 值 时 的 解释 是 完全 相同 
的 。 这 种 假定 并 不 像 表 面 上 这 么 严格 。 为 了 能 够 看 清楚 这 一 点 ， 让 我 们 考虑 以 
下 由 Lime 和 Rubin (1987) 以 及 Schafer (1997) 所 提出 的 由 于 各 种 损耗 (a- 
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trition) 而 产生 的 三 种 数据 缺失 的 情况 。 

1, 损耗 可 能 导致 完全 随机 缺失 (missing completely at random， 简 标 为 
MCAR ) ， 当 缺失 的 时 点 是 所 有 时 点 的 一 个 随机 样本 ， 或 者 遗漏 的 被 访 者 是 所 
有 被 访 者 的 一 个 随机 样本 时 ， 所 得 的 数据 就 是 完全 随机 缺失 (MCAR) 的 数 
据 。 在 这 种 情况 下 ， 简 单 地 应 用 传统 方法 得 到 的 就 是 无 偏 估 计 ， 例 如 仅 分 析 那 
些 有 完整 数据 的 案例 。 然 而 ,假定 数据 为 完全 随机 缺失 一 般 而 言 是 令 人 难以 置 
信 的 ， 也 不 容易 证 实 ， 而 且 存 在 风险 。 此 外 ， 抛 弃 那 些 数据 不 完整 的 案例 还 会 
损失 精度 ， 在 有 些 研 究 中 精度 损失 还 会 很 大 。 

2. 数据 也 可 以 是 随机 缺失 (missing at random ， 简 标 为 MAR) 的 。 在 给 定 
的 一 个 观测 数据 中 ， 某 个 时 点 上 的 数据 缺失 的 概率 独立 于 所 有 缺失 数据 时 ， 就 
是 随机 缺失 的 情况 。 当 观测 数据 能 够 很 好 地 抓 住 关键 的 复合 效应 时 ， 这 个 假定 
就 是 合理 的 ， 例 如 ， 当 变量 同时 与 损耗 和 结果 变量 有 关 时 。 在 这 种 随机 缺失 的 
情况 下 ， 如 果 以 下 两 种 情况 都 符合 ， 那 么 对 实验 处 理 效应 的 估计 将 是 无 偏 的 : 
(a) 在 分 析 中 应 用 了 所 有 的 数据 ; (b) 采用 的 估计 方法 是 完全 有 效 的 (fully 
efficient) 。 例 如 ， 应 用 最 大 似 然 估计 的 分 层 模型 将 会 有 效 地 利用 所 有 可 得 的 
时 点 数据 来 进行 模型 估计 ， 并 保证 在 随机 缺失 的 情况 下 对 处 理 效应 的 估计 是 
渐 近 无 偏 的 。 在 上 述 条 件 成 立时 ， 产 生 缺 失 的 机 制 就 可 以 忽略 不 计 。 应 用 多 
元 的 、 以 模型 为 基础 的 归 因 方法 (Little & Rubin, 1987; Schafer, 1997) 在 
数据 为 随机 缺失 的 情况 下 也 能 保证 可 以 忽略 这 种 缺失 (进一步 的 讨论 请 见 第 
11 章 ). 

3， 当 数据 既 不 是 完全 随机 缺失 也 不 是 随机 缺失 时 ， 就 是 不 可 忽略 的 缺失 
(nonignorable missingness ) 。 在 这 种 情况 下 ,损耗 的 概率 的 确 依赖 于 缺失 值 ， 
即使 在 控制 了 所 有 观测 数据 以 后 也 是 这 样 。 统 计 结果 对 不 可 忽略 的 缺失 的 稳健 
程度 取决 于 以 下 因素 的 程度 ， 即 : (a) 所 有 数据 都 被 有 效 地 应 用 ; (b) 缺失 信 
息 的 比例 很 小 。 久 

Little (1995) 与 Hedeker Al Gibbons (1997) 曾 描 述 了 一 种 在 所 谓 的 模式 
混合 模型 (pattern-mixture models) 中 分 析 有 不 可 忽略 的 缺失 的 历时 数据 的 方 


D HE: 这 种 损耗 通常 指 调查 对 象 死亡 ， 失 上 防 、 不 惹 青 接受 观察 等 情况 ， 因 而 无 法 继续 对 其 进行 
测 其 - 

O 散失 信息 的 比例 并 不 基 缺 失 数据 点 的 比例 ; 相反 ， 它 与 缺失 数据 中 不 能 被 观测 数据 所 解释 的 变 
化 量 有 关 ， 如 果 观 测 数据 与 缺失 数据 之 间 具 有 很 强 的 相关 性 ， 即 使 缺失 案例 的 比例 相当 大 ， 缺 
失 数 据 的 比例 也 是 很 小 的 
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法 。 利 用 这 种 方法 ， 将 调查 对 象 按照 其 数据 模式 来 分 组 ， 而 重要 的 关系 也 是 在 
这 些 组 内 进行 估计 ， 这 就 使 得 分 析 者 能 够 评估 对 损耗 推论 的 敏感 性 。 


利用 分 层 模型 来 预测 未 来 状况 


本 章 的 首要 目的 是 示范 如 何 利用 分 层 线性 模型 来 建设 性 地 研究 个 体 变化 。 
我 们 还 介绍 了 一 些 常用 的 层 -1 模型 的 设置 和 和 解释， 以 及 对 增长 假设 的 检验 。 

正如 第 1 章 和 第 3 章 所 提 到 的 ， 分 层 线性 模型 的 另 一 个 优点 在 于 ， 将 层 -1 
系数 的 经 验 贝 叶 斯 估计 ， 如 方程 6. 20 中 的 增长 参数 等 ， 与 仅 用 每 个 个 体 的 离 
散 时 间 段 趋势 数据 进行 最 小 二 乘法 估计 诅 比 ， 前 者 具有 更 小 的 均 方 误 。 这 个 特 
点 在 许多 实际 应 用 中 被 证 明 非 常 有 用 。 例 如 ,第 4 章 曾 用 对 层 - 1 系数 的 经 验 
贝 叶 斯 估计 来 识别 那些 具有 异常 效应 模式 的 组 织 。 在 增长 研究 中 ， 当 需要 估计 
个 人 增长 曲线 时 (如 要 预测 未 来 状况 ) ， 这 种 方法 也 非常 有 用 。 现 在 我 们 利用 
前 面 分 析 过 的 词汇 量 数据 的 一 部 分 来 进行 示范 。 

为 了 比较 ， 我 们 将 以 前 22 个 月 的 数据 为 基础 ， 来 预测 在 第 24 个 月 时 的 词 
汇 量 ， 然 后 再 对 这 些 预 测 值 与 实测 值 进行 比较 。 具 体 地 说 ， 我 们 建立 一 个 与 方 
程 6. 15 相同 的 层 - 1 模型 和 一 个 与 方程 6. 17 相同 的 层 -2 无 条 件 模型 。 然 后 
我 们 对 两 种 方法 所 得 的 每 个 儿童 在 第 24 个 月 时 的 预测 值 进行 比较 : 一 种 是 根 
据 经 验 贝 叶 斯 方法 所 得 的 ru 估计 (见方 程 6. 20) ， 另 一 种 是 无 截 距 的 二 次 项 
回归 的 最 小 二 乘法 估计 。 结 果 在 表 6. 15 中 列 出 。 第 1 列 是 22 名 儿童 在 第 24 
个 月 时 刘 汇 量 的 实测 值 ， 第 2 列 和 第 3 列 分 别 是 最 小 二 乘法 和 经 验 贝 叶 斯 估计 
的 预测 值 。 第 4 列 和 第 5 列 分 别 是 相应 的 预测 误差 。 


ROIS 年 龄 在 24 个 月 时 的 分 层 模型 与 最 小 二 所 法 模型 的 预测 值 比较 
案例 实测 词汇 最 OLS 预测 经 验 贝 叶 斯 预测 OLS RH ERUR 








1 139. 00 126. 649 127, 898 12. 351 11. 102 
2 449. 00 505. 802 512. 202 - 56. 802 ~ 63. 202 
3 142. 00 11. 458 111. 028 30. 542 30. 972 


4 579. 00 723, 594 702. 335 = 144. 594 ~ 123. 335 
5 317.00 326. 472 311. 864 -9.472 5. 136 


6 78. 00 56. 648 55. 519 21. 352 22. 481 
CE 
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续 表 6.15 

SCAM DATA OLS MANET MM OLSI 经 验 贝 叶 斯 误 关 

577.00 703, 864 7 f 690. 083 — 126. 864 j = 113. 083 j 
8 491. 00 489. 922 492, 341 1.078 -1.341 
9 595. 00 634. 180 656. 442 - 39, 180 = 61.442 
10 604. 00 727. 508 715. 186 - 123, 508 ~ TNL. 186 
n 137.00 145. 040 138. 352 -8. 040 -1.352 
12 350. 00 366, 000 346. 939 = 16. 000 3. 06) 
13 149. 00 126. 007 134. 250 22. 993 14. 750 
14 56. W 6. 007 28. 904 49. 993 27. 096 
15 188. 00 186. 000 239. 329 2. 000 -51.329 
16 172. 00 228. 007 240. 512 -56. 007 -68.512 
17 240. 00 174, 007 190. 903 65. 993 49. 097 
18 292. 00 153. 007 167. 123 138. 993 124. 877 
19 99.00 111. 007 127. 636 - 12, 007 — 28. 636 
20 142. 00 174, 000 176. 779 - 32.000 -34.779 
21 265. 00 120. 000 163. 448 145. 000 101. 552 
22 329. 00 437. 007 432, 892 ~ 103. 007 - 103, 892 

预测 值 均 方 误 的 平方 根 75.30 66.51 





WE, TE MRA TRALEE AR), WEE Bt e it A 9 aR EB HEE 
要 小 于 最 小 二 乘法 的 估计 结果 (66. 51 对 75. 30) 。 这 主要 是 因为 经 验 贝 叶 斯 估 
计 对 某 些 极端 案例 的 预测 较 好 ， 例 如 第 4、7 、10 、18 号 案例 ， 特 别 是 第 21 号 
案例 。 经 验 贝 叶 斯 估计 的 优点 在 这 个 例子 应 用 中 的 体现 还 算是 一 般 的 ， 因 为 本 
研究 采用 了 比较 仔细 的 测量 程序 ， 最 小 二 乘法 的 估计 也 相当 可 靠 。 对 于 本 预测 
应 用 的 模型 而 言 ， 分 层 分 析 估计 的 线性 增长 率 部 分 的 可 靠 性 为 0.51 ， 而 二 次 
项 则 为 0.88。 这 一 点 同样 也 可 以 从 图 6.1 中 看 出 ， 其 中 个 人 的 最 小 二 乘法 的 二 
次 轨迹 与 观测 数据 之 间 非 常 接近 。 

一 般 来 说 ， 当 应 用 于 带 有 很 大 随机 波动 的 时 间 趋 势 数据 时 ， 经 验 贝 叶 斯 估 
计 比 最 小 二 乘法 估计 的 优越 性 就 表现 得 更 加 明显 了 。 即 使 是 这 样 ， 还 是 要 保持 
常规 的 说书。 多项式 增长 模型 只 能 对 与 大 多 数 数据 的 时 间 点 相对 比较 接近 的 时 
点 提供 比较 可 靠 的 预测 值 。 在 我 们 这 个 例子 中 ， 对 于 年 龄 为 24 个 月 的 预测 看 
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起 来 还 比较 合理 ， 但是， 如 果 对 远 超 过 第 24 个 月 的 时 点 做 预测 的 话 ， 预 测 值 
就 不 那么 可 信 了 


增长 与 变化 的 研究 设计 中 有 关 功 效 的 考虑 


在 第 5 章 中 ,我 们 曾 讨论 过 在 组 织 研究 设计 中 的 功效 问题 。 我 们 曾 指 出 ， 
如 何 选 择 样 本 最 n、 每 个 组 织 中 的 人 数 以 及 组 织 的 个 数 J， 都 将 会 影响 到 检测 
各 种 效应 的 功效 。 我 们 看 到 ，n 和 对 功效 的 影响 主要 取决 于 组 织 之 内 与 组 织 
之 间 方 差 幅 度 的 大 小 、 每 一 层 抽样 的 成 本 以 及 所 研究 的 问题 。 

在 重复 测 大 的 研究 中 ， 类 似 的 样本 规模 是 每 一 个 人 的 时 点 数 7 和 人 数 n。 
人 们 也 许 会 认为 ， 当 个 人 内 部 的 方差 oa* 比较 大 时 ， 最 有 用 的 是 增加 时 点 数 ; 
而 当 增长 率 的 人 际 差别 很 大 时 ， 最 有 用 的 是 增加 样本 规模 n。 这 种 直觉 有 一 些 
道理 ， 但 设计 上 的 问题 会 更 为 复杂 。 

， 在 一 个 重复 测量 的 研究 中 ， 通 过 增加 每 个 单位 时 间 上 的 观测 频数 (保持 
研究 期 间 不 变 ) ， 或 者 是 延长 研究 期 间 (保持 观测 频数 不 变 ) ， 都 可 以 增加 时 
点 数 7。 但 是 这 两 种 增加 T 的 方法 在 成 本 和 收益 上 却 是 相当 不 同 的 。 

设 DD 为 研究 的 总 时 间 ， 取 某 种 有 意义 的 测量 单位 (如 年 )， 再 设 7 为 时 间 
序列 上 的 观测 次 数 。 例 如 ， 本 章 曾 分 析 过 全 国 青年 调查 的 数据 ， 它 始 于 1976 
年 ， 到 1980 年 结束 ， 因 此 , D =4 年 ,7T=5 个 时 点 〈 第 一 个 时 点 是 1976 年 年 
初 ， 其 后 参与 者 每 年 都 被 访问 一 次 ， 直 至 1980 年 ) 。 与 此 类 似 ， 在 词汇 量 增长 
研究 中 , D=14 +A (BI Huttenlocher 等 人 在 儿童 年 龄 为 12 ~ 26 个 月 之 间 时 进 
行 观测 )， 而 完整 数据 包括 7=8 个 时 点 ( 即 12、14、16、18、20、22 24 和 
26 个 月 ) 。 假 定 有 相同 间隔 的 时 点 是 从 时 间 0 开始 的 ， 那 么 观测 频数 就 是 f= 
(7T-1)/D。 对 于 全 国 青 年 调查 , f 等 于 每 年 1 次 ， 而 对 于 词汇 量 增长 调查 来 
说 , /就 等 于 每 个 月 0.5 次 。 

假设 线性 增长 模型 为 ; 

Ya = m, + ma, tess es ~ N(O,o°) (6. 37] 
其 中 ,在 时 点 1=0, 1, =, T-1 时, a, = De/(T-1), Raudenbush 和 Liu 
(2001) 曾 证 明 ， 对 个 人 增长 率 的 最 小 二 乘法 估计 值 为 : 


Varia, | m) = V, = — = ¢/eren [6.38] 
' i mon T}/ 12(T-1) 
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现在 假设 我 们 的 研究 目的 是 比较 两 个 实验 处 理 组 (一 个 实验 组 和 一 个 控制 组 ) 
各 自 的 平均 增长 率 ， 相 应 的 层 -2 模型 为 ; 


Ta = By + ByX, tuus uu ~ N(O,7,) [6.39] 


这 里 ， 如 果 是 实验 小 组 有 所 =1; 如 果 是 控制 小 组 则 取 0。 检 测 这 些 处 理 效应 
的 功效 将 取决 于 非 中 心性 (noncentrality) BRK; 


p = nàð’/4 [6.40] 


ERAF df= (1, n-2) AF Sd, HH, 8=8u/lru) 2， 是 标准 化 的 效应 
规模 ， 而 A ATRE: 


A = t/(ty + ¥,) [6.41] 


AKERI A E HE R a E E a 而 改变 非 中 心性 参数 。 例 
如 ， 假 设 我 们 选择 了 =5 个 时 点 ， 且 每 年 观察 一 次 ， 那 么 时 间 为 D =4。 然 后 ， 
利用 方程 6. 38 和 6. 41 HW, PREX rlr + /10)。 另 一 方面 ， 如 果 时 
点 数 相同 但 每 年 观测 2K, MERER D=2, MRM TRE r/C Tn + 
0 /2. 50) ， 它 有 可 能 会 变 得 很 小 ， 特 别 是 当 方 差 o 远大 于 7, 时 。 尽 管 时 点 数 
保持 不 变 ， 第 二 种 方法 的 可 车 性 较 小 ， 因 为 研究 时 间 被 缩短 ， 从 而 减少 了 在 个 
人 增长 率 估 计 中 的 杠杆 作用 。 

当 方差 ”相对 小 于 7,, ， 且 个 人 增长 率 差别 较 大 时 ， 可 靠 性 就 会 向 1.0 收 
敛 。 在 这 种 情况 下 ， 总 样本 规模 在 决定 功效 时 的 作用 ， 要 远大 于 观测 频数 或 研 
究 时 间 的 作用 。 上 述 公式 仅 可 以 用 在 线性 增长 模型 中 。Raudenbush 和 Liu 
(2001) 评估 了 高 次 多 项 式 (如 加 速度 ) 增长 模型 的 功效 ， 并 提供 了 类 似 的 
结果 。 


7 


HLM 在 元 分 析 和 其 他 层 -1 方差 
已 知情 况 下 的 运用 


日 导言 

© 为 元 分 析 建 立 模型 

e 例子 : 教师 对 学 生 智商 期 望 的 效应 
8 其 他 层 -1 方差 已 知 时 的 问题 

© 多 元 的 方差 已 知 模型 

© 不 完整 多 元 数据 的 元 分 析 


导 8 


许多 领域 的 研究 者 都 对 从 一 系列 相关 研究 中 总 结 出 结论 的 定量 方法 感 兴 
趣 ， 这 种 形式 的 探索 被 称 为 “元 分 析 ” (meta-analysis) (Glass,1976)， 或 称 
“综合 研究 ” (research synthesis) (Cooper & Hedges，1994) ， 在 这 种 “对 研究 
的 研究 ”中 ， 一 个 研究 就 成 了 对 同一 假设 进行 检验 的 一 系列 研究 中 的 一 个 
案例 。 

元 分 析 的 关键 问题 是 各 研究 结果 的 一 致 性 。 如 果 每 个 新 实验 的 实施 产生 相 
同 的 效应 ， 那 么 将 整个 系列 研究 概括 为 一 个 单一 的 共同 效应 规模 估计 就 是 顺 理 
成 章 的 事 了 。 然 而 ， 如 果 研 究 结果 不 一 致 ， 也 就 是 说 实验 效果 的 大 小 在 各 个 研 
究 之 间 有 所 不 同 ， 那 么 元 分 析 的 主要 任务 就 是 建立 并 检验 这 样 一 个 问题 的 可 能 
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WERE: 为 什么 这 些 赋 究 的 结论 有 变化 ? 哪些 实验 特征 、 对 象 背 景 、 研 究 环境 或 
者 是 研究 方法 有 可 能 导致 这 些 研究 结果 出 现 不 同 ? 

在 评价 研究 结果 的 一 致 性 以 及 在 解释 不 一 致 时 最 主要 的 困难 就 是 ， 即 使 每 
个 研究 结果 得 到 的 都 是 问 一 “真正 的 ”效应 ， 这 一 效应 的 估计 在 不 同 研究 之 
间 仍 然 会 由 于 抽样 误差 而 有 所 变化 。 例如， 在 “真正 的 ”实验 中 ， 实 验 效应 
的 估计 会 受到 实验 效果 的 影响 ， 以 及 实验 组 与 控制 组 之 间 的 随机 差异 的 影响 。 
办 此、 即使 研究 具有 完全 相同 的 研究 设计 和 实施 ， 或 者 即使 研究 的 样本 都 是 从 
同一 总 体 中 随机 抽取 的 ， 从 一 -系列 研究 中 所 得 的 一 套 效应 估计 仍然 会 出 现 变 
异 。 元 分 析 面 对 的 任务 就 是 辨别 效应 估计 中 的 变异 成 分 ， 其 中 第 一 种 成 分 源 于 
抽样 误差 ， 第 二 种 成 分 则 是 由 于 效应 规模 参数 之 问 的 不 一 致 。 

如 果 发 现 了 不 一 致 ， 那 么 就 可 以 建立 一 个 模型 来 对 其 进行 解释 。 这 时 ， 差 
异 成 分 的 问题 还 会 产生 : 在 研究 效应 估计 中 的 残 差 变异 中 ， 在 多 大 程度 上 是 反 
映 抽样 误差 ， 又 在 多 大 程度 上 是 代表 模型 所 不 能 解释 的 真正 的 不 一 致 。 

分 层 模型 提供 了 一 个 非常 有 用 的 框架 ， 来 解决 元 分 析 中 差异 成 分 的 问题 
(Raudenbush & Bryk, 1985) , 这 个 模型 使 元 分 析 可 以 完成 的 任务 有 : (a) fh 
计 不 同 研究 的 平均 效应 规模 ; (b) 估计 效应 规模 参数 的 方差 ;(c) 估计 每 一 
线性 模型 的 效应 规模 参数 的 残 差 方差 ;(d) 利用 所 有 研究 的 信息 对 每 一 研究 
的 效应 做 出 经 验 贝 叶 斯 估计 ，。 

当 研 究 关注 于 具体 研究 的 实际 效应 规模 时 ， 最 后 一 项 任务 便 是 重要 的 。 我 
们 将 在 后 面 对 这 种 情况 加 以 示范 ( 见 “ 无 条 件 分 析 " )。 第 13 章 扩展 了 这 种 方 
法 ， 利 用 完全 贝 叶 斯 方法 估计 效应 规模 的 后 验 分 布 。 

作为 第 2 版 新 增加 的 内 容 ， 我 们 还 考虑 到 在 多 变量 模型 中 并 非 所 有 研究 都 
报告 了 一 套 完整 的 效应 规模 时 的 情况 。 我 们 将 示范 如 何 将 处 理 缺失 数据 的 多 元 
模型 应 用 到 这 种 问题 上 。 


元 分 析 数 据 的 分 层 结构 


将 分 层 线性 模型 运用 到 元 分 析 中 来 是 非常 自然 的 事情 ， 因 为 这 种 元 分 析 数 
据 也 具有 分 层 结构 ,对象 “ 典 套 ” 于 不 同 研究 之 中 。 模 型 需要 区 分 对 象 层次 
和 研究 层次 的 变异 。 其 实 ， 每 一 项 研究 的 分 析 者 都 试图 搞 清 不 同 对 象 之 间 的 差 
异 来 源 ， 那 么 元 分 析 者 的 任务 就 是 将 不 同 研究 中 的 变异 筛选 出 来 。 

本 书 前 面 所 讨论 的 研究 本 身 就 可 以 被 看 成 是 元 分 析 。 例 如 ， 在 第 5 章 中 我 
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们 将 学 校 理解 为 学 生 背 景 与 其 数学 成 绩 之 间 的 一 种 关系 。 层 -2 模型 使 我 们 能 
够 比较 各 所 学 校 之 间 这 种 关系 的 差异 。 在 这 种 意义 上 ， 每 所 学 校 就 是 社会 背景 与 
成 绩 之 间 关 系 的 一 个 研究 层 -2 模型 使 我 们 能 够 将 这 些 “ 研 究 ”结果 组 合 在 一 
起 来 评价 这 种 关系 的 一 致 性 ， 并 对 不 一 致 性 做 出 解释 。 同 样 ， 第 6 章 的 增长 例子 
也 吕 以 视 为 元 分 析 。 每 个 儿童 的 数据 提供 了 一 个 年 龄 与 结果 之 间 关 系 的 “ 研 
究 ”， 通 过 将 这 些 儿 童 的 数据 组 合 在 一 起 ， 我 们 就 能 够 研究 这 种 关系 的 变化 。 

然而 ,元 分 析 的 两 个 特征 将 它 与 前 几 章 所 描述 的 研究 区 别 开 来 : 第 一 ,在 
无 分 析 中 ， 不 一 定 都 可 以 得 到 每 个 研究 的 原始 数据 ， 元 分 析 所 能 得 到 的 往往 仅 
是 研究 报告 中 的 概要 统计 。 第 ， 不 同 的 研究 常常 会 用 不 同 的 测量 指标 ， 尽 管 
它们 可 以 被 看 成 是 相同 结构 的 测度 。 例 如 ， 在 下 面 报告 的 一 系列 研究 中 ， 研 究 
者 关于 老师 对 学 生 智 商 的 期 望 所 用 的 是 不 同 的 智商 测试 ， 每 个 测量 值 都 有 不 同 
的 八 度 。 

为 了 解决 这 些 问题 ， 元 分 析 运 用 了 一 系列 标准 化 的 效应 测度 ， 最 常用 的 是 
标准 化 均值 差 和 相关 系数 (更 详细 的 内 容 请 见 Cooper & Hedges，1994) 。 利 用 
标准 化 的 效应 测度 将 所 有 的 研究 结果 转换 为 相同 的 尺度 ， 从 而 可 以 加 以 比较 。 


扩展 到 其 他 层 -1“ 方 差 已 知 ” 的 问题 


如 果 标 准 化 效应 测度 是 根据 中 等 样本 取得 的 ， 比 如 每 个 研究 中 有 30 个 或 
更 多 的 样本 ， 那 么 统计 基 的 抽样 分 布 就 会 近似 于 正 态 分 布 ， 其 抽样 方差 也 可 以 
假设 是 已 知 的 〔 匈 下面 ) 。 因 此， 从 统计 的 角度 来 讲 ， 元 分 析 为 分 析 者 提供 了 
-系列 独立 的 效应 估计 值 ， 它 们 都 服从 正 态 分 布 ， 并 且 层 -1 的 方差 已 知 。 

有 趣 的 是 ， 除 了 元 分 析 以 外 ， 许 多 其 他 的 研究 问题 都 有 这 种 相同 的 结构 。 
众多 研究 中 的 每 一 个 都 可 以 提供 一 个 单独 的 统计 量 (比如 标准 差 、 比 例 或 相 
关系 数 ) ， 而 其 目标 则 是 比较 这 些 统计 量 。 通 常 ， 统 计量 的 转换 可 以 证 明正 态 
分 布 及 方差 已 知 的 假设 ， 我 们 将 这 种 情况 称 为 层 - 1 方差 已 知 (variance- 
known， 或 V-known) 的 应 用 。 于 是 ， 元 分 析 也 就 代表 了 这 类 情况 的 一 个 重要 
特例 。 


本 章 结构 


我 们 首先 考虑 分 层 线性 模型 在 这 种 元 分 析 中 的 应 用 ， 其 中 系列 研究 的 每 一 
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个 都 能 得 到 一 个 标准 化 的 效应 。 下 一 节 将 介绍 模型 的 建立 ， 再 下 一 节 描 述 它 在 
研究 教师 对 学 生 智 商 的 期 望 值 效应 中 的 运用 。 接 下 来 的 一 节 是 将 元 分 析 方法 扒 
广 到 更 广泛 的 “ 尾 - !1 方差 已 知 ”的 问题 ， 最 后 的 两 节 将 讨论 层 - 1 为 多 结果 
变量 的 情况 。 


为 元 分 析 建 立 模型 
标准 化 均值 差异 


正如 上 面 提 到 的 ， 元 分 析 很 少 能 得 到 每 个 研究 的 原始 数据 ;， 相反， 所 能 得 
到 的 是 对 研究 对 象 的 数据 的 某 一 概括 性 统计 指标 ， 这 个 统计 量 表示 了 效应 的 幅 
度 或 各 变量 之 间 联 系 的 强度 ， 我 们 将 第 /个 研究 的 “效应 规模 估计 ”标注 
4 d,s 

在 许多 实际 应 用 中 , d, 是 一 个 实验 组 与 一 个 控制 组 之 间 标 准 化 的 均值 
ZB: 


其 中 : 

Jo 是 实验 组 的 平均 结果 ; 

Jo 是 控制 组 的 平均 结果 ; 

5; 是 汇合 的 组 内 标准 差 。 

每 个 山 都 是 实验 组 与 控制 组 用 标准 离 差 单位 测量 的 总 体 平 均值 差异 的 估 
计 值 。 例 如 ，d, =0.50， 表 示 在 第 j 个 研究 中 ,实验 组 对 象 的 估计 值 在 平均 水 
平 上 比 控制 组 对 象 高 出 半 个 标准 差 。 

统计 量 d, 也 可 以 被 视 为 相应 总 体 参数 8 的 估计 值 ， 这 里 : 


8, = (ps ~ pa)/0, [7.2] 


当然 ,4d; 作为 8 的 估计 值 的 准确 性 取决 于 实验 组 和 控制 组 各 自 的 样本 规模 ny 
和 nc。Hedges (1981) 说 明 ， 对 于 一 个 8 的 固定 值 ， 统 计量 d 是 近似 无 信 
的 ， 而且 服 从 方差 为 V 的 正 态 分 布 ， 即 ; 


dl6 ~ N(6,.V,) [7.3] 
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Herp. 
V, = (ny +ny)/ (ngng) +8 (2( ny, +nc)] [7.4] 


事实 上 ，d, 并 不 是 确切 无 偏 的 。Hedges (1981) 也 提供 了 当 ms 或 rc 非常 小 时 
特别 有 用 的 一 种 对 偏差 的 矫正 方法 。 更 通常 的 做 法 是 ， 用 省 代替 方程 7.4 中 
的 5， 然后 假定 为 “已 知 ”。 


层 -1 (研究 之 内 ) 模型 


层 -1 模型 是 比较 简单 的 ， 对 于 研究 j=1，…，J， 有 : 
d, = 6, + e, [7.5] 


其 中 , e Ed, (6, 的 估计 值 ) 相关 联 的 抽样 误差 ， 并 假设 ~N(0, V) 

我 们 注意 到 ， 方 程 7.5 在 推广 到 元 分 析 时 用 的 是 效应 规模 测度 ， 而 不 是 标 
准 化 的 均值 差异 。 也 就 是 说 ，d, 是 研究 j 中 的 任意 的 标准 化 效应 测度 ; 5 是 相 
应 的 参数 ; V 是 作为 8 估计 的 d 的 抽样 方差 。 例 如 ， 假 设 一 个 相关 系数 r 是 
由 一 系列 研究 所 报告 的 ， 那么 ， 慰 准 化 效应 测度 d 为 : 


d, = Fogl (1 +5)/(1 -7)) [7.6] 
而 相应 的 参数 是 ; 
8 = pol (1 +p)/(1 -p)] [7.7] 
抽样 方差 4, 近似 为 : 
V, = 1/(n, -3) [7.8] 
其 中 : 
r, 是 研究 j 中 观测 的 两 个 变量 之 间 的 样本 相关 系数 ; 
p; 是 相应 的 总 体 相 关系 数 ; 


i Hedges 和 Olkin (1983) 提供 了 一 个 出 的 转换 ， 以 消除 样本 方差 对 5 的 依赖 性 。 这 种 转换 在 
mg 或 mo 非常 小 时 特别 有 用 。 
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n, EGE | 中 的 样本 规模 
在 这 个 例子 中 ，d 是 “Fisher 的 r-Z” 转 换 。 TER, V, 独立 于 未 知 的 Pi， 
而 这 下 是 一 个 优点 。 


Fe -2 (研究 之 间 ) 模型 
fi -2 模型 中 ， 真 正 的 未 知 效应 规模 6, 取决 于 研究 特征 和 层 -2 的 随机 
RIE: 
B= yo + YW + YW + + Wy + u, 


[7.9] 
= yo + YW, +4, 


其 中 : 
Why ，…，8s 表 示 影 响 这 些 效应 规模 的 研究 特征 ; 
Yor ts y, 为 回归 系数 ; 
山 是 层 -2 随机 误差 项 ， 假 定 其 服从 u ~N(0, 7) - 


将 方程 7.9 代入 方程 7.5 就 可 以 得 到 观测 d, 的 单一 方程 : 
d, = Ya + Ertu te [7.10] 
显而易见 ，d, 服从 正 态 分 布 : 
d ~ N(y + Erw, +) 


为 了 简单 起 见 ， 我 们 标注 : 


Var(d,) =r+V, =4 (7.11) 


估计 


这 里 的 估计 是 按 第 3 章 所 介绍 的 基本 程序 来 进行 的 ， 但 由 于 假定 Y 已 知 ， 
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所 以 程序 已 被 简 化 。 现 在 仅 有 一 个 方差 成 分 7 需要 估计 。 给 定 7 的 一 个 最 大 似 
然 估 计 ， 那 么 层 -2 系数 ( 即 不 同 的 y) 可 以 通过 加 权 的 最 小 二 乘法 来 估计 ， 
其 中 权 数 即 为 方程 3. 17 中 的 精度 A 

每 个 研究 的 效应 8 的 经 验 贝 叶 斯 估计 值 5” 是 : 


6 = Ad + (1 -A)(y + Dy,W,) (7. 12} 


其 中 ,A; = TAO + Vive 


例子 : 教师 对 学 生 智商 期 望 的 效应 


教师 对 学 生 智 商 (Intelligence quotient) 的 期 望 会 影响 学 生 智 力 发 展 ， 这 
-假设 已 被 持续 地 激烈 争论 了 一 十 多 年 【参见 Wineburg (1987) 的 综述 和 
Rosenthal (1987) 的 回应 ] 。Raudenbush (1984) 找到 了 19 个 这 种 假设 检验 的 
实验 报告 。 在 这 些 研究 中 ， 教 师 被 告知 实验 组 儿童 有 “高 ”智商 的 期 望 ， 控 
制 组 的 儿童 则 并 未 被 赋予 特殊 期 望 、 这些 研 究 的 样本 规模 和 报告 的 标准 化 均值 
差异 都 列 在 表 7.1 中 。 


表 7.1 教师 对 学 生 智商 的 期 望 效应 的 实验 研究 
实验 前 师 生 ”效应 规模 山 的 经 验 贝 叶 斯 估计 值 5 





研 究 接触 的 周 数 Mit, d, 标准 误 无 条 件 模型 ” 条 件 模 型 
a Rosenthal Şi 1974) a a2 0.03 i 0, 125 0.05 0.09 
2. Conn F (1968) 3 0.12 0. 147 0.10 ~0. 06 
3. Jose & Cody (1971) 3 -0.14 0. 167 -0.00 -0.06 
4, Pellegrini & Hicks (1972) 0 118 0. 373 0, 22 0.41 
5. Pellegrini & Hicks (1972) 0 0. 26 0. 369 on 0.41 
6. Evans & Rosenthal (1969) 3 -0. 06 0. 103 -0.01 -0.06 
7. Fielder F (1971) 3 -0.02 0. 103 0.02 -0.06 
8. Claibom (1969) 3 -0.32 0. 220 -0.03 - 0.06 
9. Kester & Letchworth (1972) 0 0.27 0. 164 0. 16 0.41 
10, Maxwell (1970) 1 0. 80 0. 251 0.25 0. 25 
II, Carter (1970) 0 0. 54 0. 302 0.16 0.41 
12. Flowers (1966 ) 0 0. 18 0. 223 0.11 0.41 
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续 表 7.1 
ERRE ”效应 规模 出 的 经 验 贝 叶 斯 估计 值 5 
研 究 接 刹 的 导数 ”的 估计 , d, 标准 误 ERMD KN 

13. Keshack (1970) T o 1 cc} om 0.289 tf 0. 06 0.25 
14. Henrickson (1970) 2 0.23 0. 290 O11 0. 09 
15. Fine (1972) 3 - 0.18 0. 159 -0.03 -0.06 
16. Greiger (1970) 3 ~0. 06 0, 167 0. 03 -0.06 
17. Rosenthal & Jacobson (1968) 1 0.30 0. 139 0.19 0. 25 
18, Fleming & Anttonen (1971) 2 0.07 0.094 0.07 0.09 
19. Ginsburg (1970) 3 -0.07 0. 174 0.02 -0.06 





看 上 去 ， 报 告 的 效应 规模 变化 很 大 ， 从 -0.32 到 1.18。 然 而 ， 一 些 极端 
的 结果 (如 研究 4) 所 用 的 是 小 样本 ， 因 而 标准 误 ( 即 42) 很 大 。 因 为 表 
7. 1 中 所 列 的 效应 估计 有 一 定 的 变异 ， 其 部 分 原因 是 由 于 每 个 d 的 抽样 误差 ， 
所 以 ， 所 有 d 的 总 变异 很 可 能 会 大 大 高 于 未 知 效应 参数 5; 中 的 变异 。 

下 面 我 们 做 两 个 分 析 : 第 一 个 分 析 的 目的 是 评价 真实 效应 参数 中 的 变异 ; 
第 二 个 分 析 的 目的 是 解释 这 种 变异 。 具 体 而 言 ， 在 第 一 个 分 析 中 ,我 们 估计 真 
实效 应 的 均值 和 方差 ， 以 及 计算 每 一 研究 的 效应 规模 的 经 验 贝 叶 斯 估计 值 。 在 
第 二 个 分 析 中 ， 我 们 建立 一 个 模型 来 预测 这 些 效应 规模 ， 以 估计 真实 效应 的 残 
差 方 差 ， 并 计算 每 一 研究 的 新 的 经 验 贝 叶 斯 估计 。 


无 条 件 分 析 


利用 方程 7.5， 层 -1 模型 为 ; 


d, = 6, + e, [7.13] 


其 中 , d (R71 中 的 第 3 列 ) 是 在 研究 ) 中 实验 组 (被 分 配 “高 期 望 ”条 
件 ) 与 控制 组 儿童 之 间 标准 化 均值 差异 的 估计 值 ; 5 是 相应 的 参数 值 。 因 此 ， 
每 一 个 d; 都 按 已 知 抽样 方差 V (在 方程 7.4 中 用 d, 替代 6 得 出 ) 估计 了 8 。 

在 无 条 件 分 析 中 ， 层 -2 模型 没有 包括 任何 自 变量 。 我 们 将 真实 效应 规模 
6; 看 作 是 围绕 总 均值 y 简单 波动 的 ， 并 加 上 了 一 个 层 -2 Ru, BK, 在 
层 -2 中 ， 


7 ”HLM 在 元 分 析 和 其 他 层 -1 方差 已 知情 况 下 的 运用 203 


ô, = Yo +t; [7. 14] 
将 方程 7. 14 代入 方程 7. 13 ， 得 到 组 合 模型 ; 
d, = Yo +u, +e, [7. 15} 


HH. d, ~ N(yo.A) ,而 A = 7+ V,, 

结果 。 表 7.2 列 出 了 总 均值 的 估计 y ME -2 方差 r。 效 应 规模 的 总 平均 
数 估计 值 较 小 ，y。=0.083， 这 意味 着 ,平均 而 言 ， 实 验 组 学 生 的 得 分 比 控制 
组 学 生 的 得 分 高 0.083 个 标准 差 单位 。 然 而 ,效应 参数 的 估计 方差 值 7 = 
0.019。 它 对 应 的 标准 差 是 0.138， 意 味 着 存 真实 效应 规模 上 存在 着 重要 的 差 
别 。 例 如 ， 高 于 平均 水 平一 个 标准 差 的 效应 为 5 =0.22， 这 并 不 是 很 小 的 
幅度 。 


表 7.2 教师 期 望 效 应 的 元 分 析 的 无 条 件 模型 

















Bi E Re ii 系数 _ 标准 误 se + 比率 
总 均值 ，yo 0.083 0.052 1.62 
随机 效应 WS Ht Aa df x p ffi 
真实 的 效应 规模 、5 0.019 18 35. 85 0. 009 


有 人 或 许 会 有 疑问 : 估计 值 7 =0. 019 会 不 会 是 一 个 偶然 性 结果 ? 利用 第 3 
章 中 介绍 的 程序 ， 我 们 来 检验 虚无 假设 H,: r =0， 其 统计 最为 : 


H = E Ca, -a y? [7.16] 


其 中 , d. = Vi 'd/ 王 V'。 这 个 统计 量 服从 -1 个 自由 度 的 x* 分 布 ， 而 且 也 
是 Hedges (1982) 与 Rosenthal 和 Rubin (1982) 所 讨论 的 “万 统计 量 "。 这 里 ， 
H =35.85, df=18, p<0.01, 表明 这 些 研 究 中 所 得 到 的 效应 之 间 的 确 存 在 着 
显著 的 差异 。 

表 7.1 (第 5 列 ) 列 出 了 经 验 贝 叶 斯 估计 值 ， 对 于 每 个 研究 有 5” = Ad, + 
(1 -A)Y。。 图 7.1 展示 了 这 些 估计 值 与 原始 估计 值 d; 之 间 的 比较 ， 每 个 研究 
的 两 个 估计 值 分 别 用 直线 连接 。 注 意 ， 经 验 贝 叶 斯 估计 值 比 d; 值 更 集中 于 
Yo =0. 083 附近 。 一 些 d, 值 ， 尤 其 是 样本 规模 很 小 的 和 距离 0.083 较 远 的 ， 发 
生 了 很 大 程度 的 收缩 。 例 如 ， 研 究 4 的 d, 值 从 1.18“ 收 缩 ” 到 0. 22, 
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1.12 
— 
oso 
aii: 
on: 
—* 
SS 


图 7.1 原始 的 标准 化 均值 差异 估计 d 与 基于 无 条 件 模型 的 
经 验 贝 叶 斯 估计 5 之 间 的 比较 


条 件 分 析 


这 种 “期 望 ”的 实验 依赖 于 蒙蔽 的 效果 。 在 一 些 案例 中 ， 实 验 者 交 给 教 
师 一 个 学 生 名 单 ， 说 明 这 些 学 生 在 智力 发 展 上 有 巨大 的 潜力 。 事 实 上 ， 这 些 
“高 期 望 ”的 学 生 已 经 被 随机 分 配 了 实验 条 件 。 在 其 他 一 些 研究 中 ， 研 究 者 提 
供给 教师 的 学 生 智商 成 绩 表 中 的 某 些 学生 的 成 绩 是 被 夸大 了 的 ， 而 这 些 学 生 已 
被 随机 分 配 了 较 高 的 期 望 条 件 。 在 这 两 种 情况 下 ， 如 果 蒙 需 失 败 了 ， 教 师 拒绝 
相信 实验 者 提供 的 信息 ， 那 么 仅仅 因为 没有 实施 实验 处 理 ， 自 然 不 会 观测 到 实 
验 效应 。 这 种 实施 的 失败 并 不 能 驶 倒 期 望 理论 ， 因 为 这 种 理论 只 有 在 实验 者 能 
够 成 功 地 改变 教师 对 学 生 的 期 望 以 后 才能 得 到 检验 。 
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Raudenbush (1984) 曾 假 设 ， 教 师 期 望 效 应 的 变化 可 能 与 其 在 面临 这 种 蒙 
蔽 信息 时 对 学 生 的 了 解 程度 有 关 ， 这 一 点 可 以 用 实验 前 师 生 接触 的 周 数 来 表 
示 。 这 种 假设 建立 在 以 前 的 研究 结果 上 ， 这 些 结果 表明 ， 当 教师 对 学 生 有 较 深 
了 解 时 ， 他 们 可 能 不 会 理 皮 这 种 新 的 但 与 其 已 形成 的 观点 有 矛盾 的 信息 。 

图 7.2 中 展示 了 这 19 个 研究 得 到 的 效应 规模 与 实验 前 师 生 交流 周 数 之 间 
关系 的 标 绘图 。 这 个 图 示 与 Raudenbush (1984) 的 假设 是 一 致 的 。 条 件 模 型 
的 估计 将 会 为 这 种 假设 提供 更 为 明确 的 检验 。 


标准 化 均值 差异 d, 
100 + 
oso >» 
Zy * 
- * * * 
一 * * 
0.00 + * * 4 
- * 
- * 
7 a aaa. l=----------- 2 FP------ 
0.00 1.00 2,00 3.00 
(0 周 ) 人 A) (2 周 ) 人 2 周 以 上 ) 
以 前 接触 周 数 W, 


图 7.2 观测 的 标准 化 均值 差异 4 (SR) 作为 师 生 以 前 接触 
ASW, (RR) 的 函数 的 标 绘图 


层 -1 模型 仍 沿用 方程 7. 5 不 变 。 在 第 2 层 ， 我 们 现在 利用 实验 前 师 生 交 
流 时 间 的 信息 来 预测 效应 规模 。 其 模型 为 ; 


ô; = Yo + yı (WEEKS), + u, [7.17] 


其 中 ， 
Yo 表示 师 生 间 没 有 前 期 交流 的 研究 的 期 望 效应 规模 ; 
ya 是 前 期 交流 时 间 相 差 一 周 的 两 个 研究 之 间 在 效应 规模 上 的 期 望 差异 ; 
(CWEEKS)， 分 别 用 0、1、2、3 来 表示 实验 前 师 生 之 间 已 经 交流 了 0、1、2 
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或 2 周 以 上 时 的 情况 ; 
u, 是 研究 j 的 残 差 效 应 规模 ， 即 没有 被 实验 前 交流 时 间 所 解释 的 那 一 部 分 


Bi, KH, uy, ~ N(0, 7)。 

我 们 注意 到 ， 现 在 7 是 效应 规模 的 残 差 方 差 或 称 条 件 方差 ， 即 真实 效应 规 
模 残 差 8 - y。- yı (WEEKS), 的 方差 。 

将 方程 7. 17 代入 方程 7.5， 得 到 : 


d; = yo + y, (WEEKS), +u, +e, [7.18] 


这 里 , 必 ~ N[yo + y, (WEEKS), 4] ， 其中, A， = 7 + 是 控制 了 实验 前 交流 
时 间 后 d, 的 条 件 方差 。 

结果 。 表 7.3 列 出 了 对 yo yi 和 7 的 估计 值 。 结果 表明 ， 当 教师 和 学 生 
之 问 实验 前 有 交流 的 话 ， 那 么 实验 效应 就 比较 小 。 最 大 的 预测 效应 产生 于 那些 
实验 前 没有 交流 的 研究 ， 有 y。 = 0. 407，t = 4.67。 随 着 交流 时 间 ( 周 数 ) 增 
加 ， 期 望 效应 规模 会 依次 减少 0. 157 (BD y, = -0.157, := -4.38)。 在 那些 
实验 前 交流 时 间 长 于 2 周 的 研究 中 ， 期 望 效 应 几乎 为 0。 显 然 ， 教 师 期 望 效应 
的 变化 在 很 大 程度 上 可 以 由 前 期 交流 时 间 来 加 以 解释 。 其 实 ， 在 控制 了 变量 
(WEEKS); 以 后 ， 对 6, RA ARK HH CLR FO, 

根据 方程 7. 18 设置 的 模型 ， 经 验 贝 叶 斯 估计 8” 为 : 


8) = Aid, + (1 +A,) (Hp + 7, (WEEKS), ] [7.19] 
然而 ， 如 果 了 7=0， 那 么 对 于 所 有 的 7 有 A = r/(r + 由) =0。 因 此 ， 在 这 种 情 
况 下 有 : 
ô = fa + Jı (WEEKS), 


R73 VAFMDAEHTH HR EMD 





周 定 效应 系数 标准 误 se + 比率 
RE, yo 0.407 0. 087 4.67 
M (WEEKS), y, -0.157 0. 036 -4.38 
随机 效应 方差 分 地 fth IE df x pitt 
MANR, 5, 0. 000 17 16. $7 >0. 500 





图 7.3 展示 了 在 本 模型 下 每 个 d 向 6” 的 收缩 (根据 方程 7. 19 得 到 的 3 
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的 经 验 贝 叶 斯 估计 在 表 7.1 的 第 6 列 )。 这 是 另 一 个 条 件 收 缩 的 例子 〈 正 如 第 
.3 章 中 所 介绍 的 ， 以 及 第 4 章 中 所 示范 的 ) 。 比 较 图 7. 1 中 d; 都 是 朝 着 总 均值 
估计 0. 083 收缩 ， 现 在 每 个 d, 都 向 一 个 基于 实验 前 交流 的 条 件 均值 收缩 。 由 
F (WEEKS); 可 以 取 4 个 值 ， 因 此 d; 就 向 这 4 个 点 收缩 。 向 这 些 点 收缩 是 完 
全 的 ， 因 为 实际 上 7 估计 为 0。 


-0.16 $ 





原始 估计 二 经 验 贝 叶 斯 估计 中 


图 7.3 原始 的 标准 化 均值 差异 估计 di 与 基于 条 件 模型 的 
经 验 贝 叶 斯 估计 6; 之 间 的 比较 


贝 叶 斯 估计 的 元 分 析 


在 教师 期 望 的 例子 中 ， 层 -2 固定 系数 y 的 估计 是 加 权 最 小 二 先 估 计 ， 其 
中 权 数 为 精度 A，。 实 际 上 ， 当 这 些 权 数 可 以 从 数据 中 得 到 估计 时 ， 便 可 以 候 
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定 其 为 已 知 。 这 些 估计 的 权 数 为 : 


A = (G+¥)" [7.20] ° 


其 中 ,了 是 研究 之 间 的 方差 估计 值 。 如 果 研 究 的 样本 规模 /比较 大 ， 这 个 方差 
估计 就 比较 精确 ， 尽 管 从 技术 上 讲 不 真实 ， 但 方程 7.20 中 权 数 已 知 的 假定 的 
实际 影响 可 以 忽略 。 但 是 ， 如 果 / 比较 小 ,那么 这 一 方差 估计 的 抽样 误差 将 相 
当 可 观 ， 导 致 y 有 额外 的 不 确定 性 。 这 种 额外 的 不 确定 性 将 不 会 反映 在 最 大 似 
然 估计 得 到 的 y 的 标准 误 上 。 当 各 研究 的 样本 规模 差异 较 大 时 ， 权 数 也 具有 高 
度 变异 性 ， 这 种 额外 的 不 确定 性 的 影响 就 会 表现 得 最 为 显著 。 而 当 数 据 接近 平 
衡 的 时 候 ， 这 种 额外 的 不 确定 性 也 可 以 忽略 ， 

贝 叶 斯 估计 方法 提供 了 另 一 个 选择 途径 ， 它 允许 分 析 者 在 对 其 他 未 知 量 的 
推断 中 充分 地 考虑 到 这 种 方差 估计 的 不 确定 性 影响 。 这 种 方法 的 优点 还 可 以 扩 
谋 到 对 具体 研究 的 效应 规模 8 的 推断 中 去 。 我 们 将 在 第 13 章 中 对 这 种 贝 叶 斯 
估计 方法 进行 详细 介绍 ， 其 中 所 分 析 的 例子 仍然 是 教师 期 望 的 数据 。 


其 他 层 -1 方差 已 知 时 的 问题 


元 分 析 之 所 以 与 本 书 所 讨论 的 其 他 方法 之 间 有 区 别 ， 其 原因 在 于 它 的 两 个 
本 质 上 的 统计 特征 : 第 一 ， 层 -1 中 仅 有 概括 性 数据 ; 第 二 ， 层 - 1 参数 估计 
4 的 抽样 方差 上 可 以 假定 为 已 知 。 许 多 非 元 分 析 研 究 的 问题 也 具有 类 似 的 结 
构 。 我 们 将 这 一 类 的 问题 统称 为 层 -上 方差 已 知 的 问题 ， 元 分 析 是 其 中 的 一 个 
特例 。 

在 一 个 方差 已 知 的 分 析 中 ， 对 于 每 个 研究 、 组 织 或 其 他 层 -2 单位 ， 都 会 
对 其 进行 分 别 计算 得 到 某 一 个 或 一 套 统计 量 。 除 了 标准 化 均值 差异 以 外 ， 这 些 
统计 量 还 可 以 是 相关 系数 、 比 例 或 者 标准 差 。 通 常 ， 对 于 这 些 统计 量 的 转换 将 
会 提高 正 态 性 与 方差 已 知 这 两 个 假定 的 合理 性 。 例 如 : 样本 相关 系数 + 有 一 个 
近似 正 态 的 抽样 分 布 ， 但 这 种 近似 性 会 很 差 ， 特 别 是 在 参数 值 接近 - 1.0 或 
1.0 的 时 候 。 用 方程 7. 6 进行 Fisher 转换 以 后 ， 对 于 p 的 非 零 值 ， 抽 样 分 布 就 
会 更 近似 于 正 态 分 布 。 并 且 r 的 抽样 方差 取决 于 未 知 的 p 值 ， 而 Fisher 转换 的 
相关 系数 7 的 抽样 方差 却 不 取决 于 它 。 

表 7.4 列 出 了 在 一 个 层 -1 方差 已 知 的 分 析 中 可 能 要 研究 的 一 些 参数 (第 
1 列 )。 表 中 也 列 出 了 对 每 个 参数 的 样本 估计 值 (第 2 列 ) 以 及 近似 的 抽样 方 
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差 (第 3 列 )。 方 程 7.5 和 7.9 这 样 的 分 层 线性 模型 可 以 用 于 所 有 这 些 统计 最 。 


表 7.4 一 些 单 变 量 方 差 已 知 的 例子 





fa - 1 BM. 6, HAt. d WMA, V 
a 5 (ng tne) / (nenc) 
标准 化 均值 差异 " (Me Mc or (ye - ¥e)/S 
+d/ [2 (ng +nc)] 
相关 系数 Dlog[ (1 +p) -p)}] Log 1 4/0 -7)] 1/(a -3) 
Logit" log[p/(1 = p) } log[p/(1 - p)) ap (lp) 
Log( sd)“ logi a) logt S) + [1/(27/)] 1/(2f) 





注 : a。 通常 ， 是 汇合 的 组 内 标准 卷 ， ns 和 jc 是 实验 组 和 控制 组 的 总 体 均 值 ， 而 了: 和 了 是 相 
应 的 样本 估计 值 。 

b Ipp 表示 总 体 中 具有 茶 种 给 定 特征 的 对 象 所 占 的 比例 ; 5 为 样本 比例 。 

e 其 中 0 表示 标准 差 ，5 为 样本 标准 差 估计 值 ， 而 /为 与 5 相关 联 的 自由 度 。 因 此 ， 当 o 为 标准 差 
时 , /=n-1; 但 当 是 有 P 个 参数 的 回归 模型 所 估计 的 天 差 标准 差 时 ， 太 = mn -p。 


例子 : 关联 的 多 样 性 


大 多 数学 校 作 用 的 研究 都 关注 于 均值 (mean) 差异 ， 然 而 ，Raudenbush 
和 Bryk (1987) 试图 研究 数学 成 绩 离 散 度 (dispersion) 的 学 校 差 异 ， 所 用 的 
数据 来 自 “高 中 及 以 上 学 校 调查 ”中 的 一 部 分 样本 ， 与 第 4 章 所 用 的 数据 类 
似 。 本 研究 的 特殊 关注 点 是 这 样 一 个 问题 : 学 校 在 组 织 、 政 策 和 实际 工作 等 方 
面 的 差异 是 否 会 影响 到 成 绩 的 离散 度 ? 规模 大 的 学 校 是 否 比 规模 小 的 学 校 更 不 
平等 ? 如 果 一 所 学 校 中 的 学 生 在 选课 上 存在 较 大 差异 的 话 ， 是 否 会 导致 学 习 成 
SA HK AN ER? 

结果 变量 的 选择 。 这 些 问题 需要 对 每 个 学 校 分 别 计 算数 学 成 绩 的 标准 差 ， 
作为 由 学 校 层次 自 变 量 的 差异 所 解释 的 结果 变量 。 为 了 更 加 可 信 ， 分 析 必 须 考 
虑 到 学 校 在 学 生 构成 上 的 差异 。 因 此 ， 研 究 者 首先 计算 了 在 控制 了 社会 经 济 状 
况 、 种 族 状况 、 性 别 以 及 以 前 学 业 背 景 后 的 残 差 (residual) 标准 差 ( 即 每 个 
学 校 的 标准 差 ) (细节 请 参见 Raudenbush & Bryk, 1987), 

标准 差 (或 者 残 差 标准 差 ) 的 抽样 分 布 在 样本 规模 很 大 时 近似 于 正 态 分 
布 ， 但 略 呈 正 偏 态 。 而 且 样本 标准 差 5; 的 抽样 方差 近似 于 a?/2n， 它 又 取决 于 
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未 知 的 总 体 标准 差 mw。 在 这 两 种 情况 下 ， 对 5, 的 对 数 转换 都 会 有 帮助 。 
log( S,) 的 抽样 分 布 比 S, 的 分 布 更 接近 于 正 态 分 布 ， 并 且 它 的 抽样 方差 并 不 取 
决 于 wj。 具体 地 说 ， 研 究 者 使 用 了 下 列 方程 : 


6, = log(o,) 
d, = log(S,) + 1/(2f) [7.21] 
K, = Of) 


HP: 

Si 是 学 校 j 的 残 差 标准 差 的 估计 值 ; 

o, 是 学 校 j 的 总 体 残 差 标准 差 ， 

65 是 a 的 自然 对 数 ; 

斤 是 与 $ 关联 的 自由 度 ; 

4d) 是 6 的 估计 值 ， 其 中 1/(2f) 是 对 负 偏差 的 小 样本 校正 值 ; 

V 是 d 的 抽样 方差 。 

在 元 分 析 的 情况 下 ， 层 -1 模型 (方程 7.5) 就 是 在 描述 估计 值 由 时 的 抽 
样 分 布 ， 其 中 现在 的 d, 8 和 的 定义 与 前 面相 同 。 

在 学 校 层次 上 ， 离 散 度 8 被 假定 作为 某 些 学 校 特 征 的 函数 而 变化 。 具 
体 地 说 ,我 们 假设 ， 在 小 规模 的 学 校 和 那些 学 生 上 相同 课程 的 学 校 会 有 较 
小 的 数学 成 绩 差 异 。 其 他 学 校 层次 的 自 变量 还 包括 各 学 校 在 学 生 的 社会 经 
济 状 况 和 学 业 背 景 方面 的 构成 变异 ， 以 及 学 校 是 教会 学 校 还 是 公立 学 校 的 
类 别 差异 : 


ô, =yo + yı (SD SES), + y,(SD BACKGROUND), + y, (SECTOR), are 
7.22 
+ yı (SIZE), + y,(SD MATH COURSES), + u, 


Hp: 
SD SES 是 在 校 学 生 社会 经 济 状况 的 标准 差 ; 
SD BACKGROUND 是 在 校 学 生 学 业 背 景 变量 的 标准 差 ; 
SECTOR 是 一 个 标识 变量 (公立 学 校 =0， 教 会 学 校 =1) ; 
SIZE 是 学 校 的 学 生 规模 ; 
SD MATH COURSES 是 在 校 学 生 上 数学 课 的 课时 数 的 标准 差 ; 
u 是 残 差 ， 我 们 假定 u, ~ N(0, 1). 
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RIS 中 的 结果 表明 ， 在 学 生 的 社会 经 济 状 况 差异 较 大 的 学 校 〈《 即 SD 
SES 有 较 大 的 正 值 )， 在 数学 成 绩 上 也 会 有 较 大 的 差异 ( = 0.231，( = 
4.64). 同样 ， 学 业 背 景 上 的 差异 也 能 解释 数学 成 绩 的 差异 (7: = 0.525，! = 
5. 78) 。 教 会 学 校 比 公立 学 校 具有 较 小 的 数学 成 绩 差异 (J= - 0.048, t=- 
2.05) ， 而 规模 大 的 学 校 比 规模 小 的 学 校 在 数学 成 绩 上 有 更 大 的 差异 (h= 
4.15 x 10“，4=2.47)。 那 些 数学 课 课时 数 有 较 大 差异 的 学 校 ， 其 数学 成 绩 也 
有 较 大 的 差异 (J, =0. 139，! =4.06) 。 

研究 者 还 发 现 ， 一 开始 自 变量 中 没有 包括 学 校规 模 和 数学 课 课 时 的 研究 中 
表现 出 学 校 类 别 有 很 强 的 效应 ， 其 中 教会 学 校 比 公立 学 校 的 差异 性 要 小 。 在 他 
们 最 后 的 分 析 中 ( 见 表 7.5)， 学 校 类 别 SECTOR 的 效应 估计 值 要 小 得 多 。 研 
究 者 认为 ， 教 会 学 校 中 成 续 差 异 更 小 的 原因 其 实 主要 是 由 于 这 些 学 校本 身 的 规 
模 较 小 ， 以 及 它们 有 限制 性 更 强 的 选课 要 求 所 导致 的 。 


RLS 学 校 特征 对 数学 成 绩 离 散 度 的 影响 








固定 效应 系数 标准 误 se + 比率 
RE, yo 1. 324 0. 1007 
SD SES, y, 0. 231 0. 0498 4.64 
SD BACKGROUND, y, 0. 525 0. 0909 5.18 
SECTOR, y, = 0. 048 0. 0235 -2.05 
SIZE, y, 4.15 «107% 1.68 x10 * 2.47 
SD MATH, ys 0.139 0.0342 4.06 
随机 效应 WE St Mit 自由 度 df x pt 
真实 的 学 校 离散 度 ，5 0.0019 154 179. 81 0.075 





这 一 点 对 检验 这 样 一 个 假设 是 很 有 用 的 ， 即 8 中 的 所 有 变化 都 已 经 被 模 
型 解释 了 ( 即 Ho:r=0)。 如 果 这 个 假设 为 真 ， 那 么 d, 中 唯一 尚未 解释 的 变化 
就 是 出 自 “估计 误差 ”( 即 用 样本 估计 值 4 来 估计 真实 差异 8 的 不 精确 性 ) 。 
这 一 虚无 假设 的 检验 统计 量 ( 见方 程 3. 103) 服从 于 自由 度 为 了 -S-1 的 好 分 
布 。 在 本 例 中 ， 这 一 统计 值 为 179. 8!， 自 由 度 为 160 -6=154， 且 p =0.075。 
这 些 结果 表明 ， 即 使 8 的 变化 中 还 有 没有 被 解释 的 ， 剩 余 的 部 分 也 很 少 。 事 
实 上 ， 我 们 的 模型 已 经 解释 了 ô 总 变化 的 85% 以 上 (这 一 解释 方差 统计 量 就 
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是 前 面 所 介绍 过 的 方程 5. 6， 它 是 通过 比较 无 条 件 模型 和 条 件 模 型 的 7 估计 值 
而 得 到 的 ) 。 


多 元 的 方差 已 知 模型 
Fe -1 模型 


多 元 模型 是 单 变量 模型 的 直接 扩展 。 在 每 个 单位 中 ，O 个 参数 8 ， 
6, ，…,6o 可 以 用 统计 量 d, ，d,，…，d。 来 估计 。 在 真实 参数 的 条 件 之 下 ， 统 
计量 被 假定 为 具有 多 元 正 态 的 抽样 分 布 ， 其 中 方差 为 7,,， 而 对 于 每 一 对 统计 
量 9 和 4'"， 协 方差 为 Y,,。 这 些 方差 和 协 方差 都 被 假定 为 已 知 。 于 是 ， 对 于 每 
一 9=1，…，0 的 单独 统计 量 的 层 -1 模型 为 : 


d, = 56。+e [7.23] 


层 -2 模型 


真实 参数 8u 作 为 层 -2 自 变 量 的 函数 变化 ， 再 加 上 误差 项 为 : 


34 


8 = yo + DyoW, + uy [7.24] 
a 


Hep, 
W, 是 自 变量 ; 
7 是 相应 的 回归 系数 ; 
wu, 是 每 个 单位 j 的 独特 效应 。 


这 些 效应 被 假定 为 服从 均值 为 0、 方 差 为 7,,、 任 意 u, 和 uw,, 之 间 的 协 方差 
为 rw 的 多 元 正 态 分 布 。 注 意 ， 对 每 个 6, 都 可 以 设置 一 套 不 同 的 层 - 2 自 
变量 。 

正如 一 元 的 方差 已 知 模型 ， 多 元 模型 可 以 被 应 用 于 许多 不 同 的 参数 上 。 
表 7.6 列 出 了 一 些 可 能 的 自 变 量 。 同 样 ， 对 这 些 自 变量 进行 转换 也 可 以 提高 
关于 du 符合 多 元 正 态 性 假设 的 合理 性 ， 以 及 符合 方差 协 方差 已 知 假设 的 合 
理性 。 
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表 7.6 一 些 多 元 方差 已 知 的 参数 











Hh -1 BH, 6, PAH, dy HE, Va HHH, Ve 

标准 化 均值 差异 *… 
> r A Dye (Me + Me) Pyd,dy 

(ay Headey (Fag es, 六 二 
“区 所 名 义 测度 的 比例 

toglp,/(1 ~ p,)] loglp,/ (1 -pO a PA -pOT -np) x -py 
mE 

log(o,) log(S,) + (17(2f)] 1/(2f) P/O) 

a a 

注 : & 每 个 样本 可 以 产生 Q 个 统计 其 ,9=1，…，Q， 其 中 d, 和 4, AIEEE 5, AS, 
的 估计 值 。 


b. HHP? (d,) = (ng + me )/(mypne) + di/[2(ne +nc)] 

e 其 中 pyw 是 用 于 估计 效应 规模 d， Ad, 的 变量 Y， 和 Tv 之 间 的 相关 系数 (Hedges & Olkin, 1985), 
d ARATE OER HE g 类 中 的 概率 是 p,， IH Ep, =]。 

e 其 中 pw 是 用 于 估计 o, 和 ov MEM Y, 和 y,. 之 间 的 相关 系数 。 


不 完整 多 元 数据 的 元 分 析 


前 几 节 描述 的 多 元 方差 已 知 模型 要 求 每 一 研究 都 测量 相同 的 0 个 结果 变 
基 。 然 而 ， 元 分 析 很 少 能 遇 到 真正 的 系列 研究 ， 即 每 一 个 研究 都 报告 完全 相同 
的 一 套 因 变量 。 通 常 ， 不 同 研究 将 会 报告 不 同 因 变 量 的 效应 规模 。 例 如 ， 在 研 
究 教师 期 望 效应 的 例子 中 ， 结 果 变 量 可 以 包括 教师 行为 、 学 生 智 商 和 学 生态 
度 。 然 而 ， 并 不 是 所 有 研究 对 这 三 个 结果 变量 都 进行 测量 。 在 下 面 的 例子 中 ， 
每 个 研究 都 评价 测试 训练 对 学 生 “ 学 业 能 力 测验 ” (Scholastic Aptitude Test, 
简 标 为 SAT) 成 绩 的 效应 。 然 而 ， 一 些 研究 进行 的 是 词汇 测试 ， 一 些 则 进行 数 
学 测试 ， 其 他 的 则 两 个 都 进行 。 

在 Kalaian 和 Raudenbush (1996) 研究 的 基础 上 ， 我 们 将 这 些 例 子 视 为 
“不 完整 多 元 数据 ”( 参见 Jennrich & Schlucter, 1996; Little & Rubin, 1987; 
Schafer, 1997) 。 在 SAT 例子 中 ， 我 们 将 每 个 研究 的 “完整 数据 ” 视 为 词汇 测 
试 和 数学 测试 的 总 效应 规模 。 在 两 种 测试 都 进行 的 研究 中 ， 观 测 数据 包括 了 成 
对 的 效应 规模 估计 。 在 仅 估计 两 者 之 中 任 一 的 研究 中 ， 观 测 数据 包括 一 项 估计 
值 ， 但 我 们 认为 必须 是 成 对 的 真实 规模 效应 估计 才 是 完整 的 数据 ， 其 中 既 要 包 
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括 词汇 测 坛 ， 也 要 包括 数学 测试 ， 

为 了 处 理 这 种 不 完整 的 多 元 数据 ， 我 们 建立 的 层 -1 模型 设置 了 观测 数据 
与 完整 数据 之 间 的 关联 。 层 -2 模型 描述 的 是 真实 效应 规模 ( “完整 数据 ”) 
是 如 何在 各 研究 构成 的 总 体 中 变化 的 。 


层 -1 模型 


与 每 个 研究 了 相关 联 的 是 0 个 “真实 的 ”效应 规模 S n yo 然而 ， 
研究 /7 只 产生 P 个 效应 规模 估计 值 4,，…，d,,， 其 中 P< 0。 层 -1 模型 将 
观测 的 效应 规模 作为 结果 ， 将 真实 的 效应 规模 作为 系数 ， 利 用 标识 变量 作为 
“ 层 -1 自 变量 "， 使 每 一 观测 的 效应 规模 与 其 真实 的 效应 规模 联系 起 来 : 


[2 
dy = YX, +e, [7.25] 
ast 


Hp, 4d fee hit 8u 时 有 X = 1; 否则 为 0。 研 究 j 中 的 估计 误差 ,被 假定 
为 服从 多 元 正 态 分 布 ， 其 均值 向 其 为 0， 方 差 协 方差 矩 阵 为 假定 已 知 的 V。V 
的 确切 结构 取决 于 效应 规模 的 类 型 ( 如 标准 化 均值 差异 、 相 关系 数 等 ， 如 表 
7.6 中 所 列 的 ) 。 


Fe -2 模型 


层 -2 模型 与 前 面 (方程 7.24) 相同 。 它 将 真实 的 效应 规模 作为 结果 ， 
这 个 结果 取决 于 研究 的 特点 ， 还 要 假定 随机 效应 为 多 元 正 态 分 布 。 


示范 例子 


SAT 得 分 可 以 影响 大 学 录取 的 决策 。 测 试 准备 项 目 声明 ， 可 以 通过 被 称 为 
“测试 训练 ”的 相对 短期 的 指导 项 目 来 推进 学 生 的 SAT 成 绩 。 为 了 评价 这 个 声 
明 ， 许 多 研究 者 已 进行 了 一 些 研究 来 比较 实验 组 (接受 训练 ) 和 控制 组 ( 没 
接受 训练 ) 。 这 些 研 究 在 实验 组 接受 训练 的 时 间 上 有 所 差异 。 评 价 这 种 训练 的 
影响 ， 以 及 探索 这 种 影响 如 何 随 训练 时 间 变 化 ， 都 是 非常 有 趣 的 。 

Kalaian 和 Raudenbush (1996) 将 来 自 47 个 研究 这 种 训练 对 SAT 成 绩 影响 
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的 数据 都 结合 在 一 起 ,其 中 仅 有 17 个 研究 报告 的 结果 里 既 有 词汇 测试 也 有 数 
学 测试 。 在 其 余 的 研究 中 ， 有 18 个 研究 仅 包括 词汇 测试 ， 而 另外 12 个 则 仅 包 
括 数 学 测试 。 作 者 对 需要 进行 多 元 分 析 的 两 个 问题 感 兴趣 : 


。 词汇 和 数学 两 种 测试 训练 的 效应 是 否 相 同 ? 
。 训练 时 间 与 效应 规模 之 间 的 联系 在 两 个 结果 之 间 是 否 有 所 不 同 ? 


层 -1 模型 。 在 这 个 例子 中 ,我 们 有 Q = 2 个 可 能 的 结果 ， 因 此 层 -1 模 
型 为 : 


dy = 5 [7.26] 


其 中 ， 如 果 d Ein A A,X, = 1; 否则 为 0。 如 果 d, 是 数学 
测试 的 效应 规模 ， 有 Xy =l; 否则 为 0。 

每 个 结果 是 一 个 标准 化 的 效应 规模 。 因 此 ， 假 定 层 -1 那些 随机 效应 的 方 
差 由 方程 7.4 给 定 ， 它 们 之 间 的 协 方差 则 如 表 7. 6 中 所 定义 的 : 


= Ply +My) | v6ypiy/2 (7.27] 


Cov(e,,,€3,) 
ngng Ne, + Ne, 


这 里 ，p,, 是 研究 j 中 词汇 测试 与 数学 测试 之 间 的 相关 系数 。 它 通常 是 通过 
这 一 研究 的 数据 来 估计 ， 或 者 是 各 过 以 前 SAT 的 大 规模 数据 来 估计 。 对 8, 和 
5x 的 样本 估计 值 被 代 人 方程 7.27。 来 自 那 些 同时 有 两 个 结果 变量 的 研究 的 方 
差 和 协 方差 组 成 了 2 x2 的 协 方差 矩阵 内， 并 假设 其 为 已 知 。 对 于 那些 仅 有 一 
个 效应 规模 的 研究 ，V, 是 与 效应 规模 相连 的 方差 。 

层 -2 模型 。 不 管 一 个 给 定 研究 估计 的 是 一 个 还 是 两 个 效应 规模 ， 我 们 都 
设想 其 有 两 个 潜在 的 “真实 ”效应 规模 ， 分 别 对 应 两 个 结果 。 因 此 ， 我 们 的 


层 -2 模型 为 : 
8, = Yw + yn x (LOG HOURS), + u, 


[7.28] 
ôy = Ym + yn x (LOG HOURS), + u, 


RE, LOG HOURS 是 实验 组 接受 训练 时 间 的 自然 对 数 ， 训 练 时 间 则 表示 为 距 


D 这 些 数据 列 于 Kalaian 和 Raudenbush (1996) 的 论文 中 。 
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所 有 研究 的 总 平均 值 的 离 差 -. 因此 ， 对 于 一 个 具有 平均 LOG HOURS 水 平 的 研 
KÉ, Yio P yw 分 别 是 词汇 测试 和 数学 测试 的 期 望 效应 规模 。 层 - 2 随机 效 
应 有 通常 的 方差 结构 ， 其 中 T 是 一 个 2 x2 的 协 方 差 和 矩阵 。 

SR, RIT 中 提供 了 这 个 模型 的 估计 值 与 标准 误 。 我 们 看 到 ， 首 先 ， 平 
均 的 训练 效应 分 别 都 是 显著 的 正 值 。 对 于 词汇 测试 有 Jao = 0.103, 4 = 4. 18; 
对 于 数学 测试 有 yw =0.099，! =2.33。LOG HOURS 和 效应 规模 之 间 的 联系 在 
数学 测试 方面 (Ya = 0.149, 1 =2.42) 要 大 于 词汇 测试 方面 (y,，= 0. 058， 
4=1.74)。 然 而 ， 多 元 假设 检验 (见方 程 3. 91) 却 无 法 拒绝 虚无 假设 : 


Ho: Yn = Ya 


其 中 , x* 统计 值 为 1.61， 自 由 度 df =1, p = 0.20, Kalaian 和 Raudenbush 
(1996) 还 将 这 一 估计 模型 的 拟 合 度 ( 见 表 7.7) 与 另 一 个 将 数学 测试 效应 规 
模 的 方差 r, 和 协 方差 ra 限制 为 0 的 模型 进行 了 比较 。 结 果 是 : 好 统计 值 为 
9.30， 自 由 度 df =2， 导 致 拒绝 虚无 假设 ， 也 就 是 说 ， 支 持 这 个 模型 应 该 包括 
2 x2 的 方差 协 方差 矩阵 T。 


表 7.7 SAT 训练 数据 的 氢 合 模型 








指 和 标 系 & 标准 误 se + 比率 pti 
对 SAT 的 词汇 测试 a j = 
RE., vio 0. 103 0.025 4.18 0. 000 
log (hours), yy 0. 058 0.033 1.74 0. 088 
对 SAT 的 数学 测试 
RE. y» 0. 099 0.042 2.33 0.029 
log (hours), Yn 0. 149 0.061 2.42 0. 024 
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9 制定 和 检验 三 层 模 型 

© 研究 组 织 内 的 个 人 变化 

© k-1 的 测量 模型 

© 估计 三 层 模 型 中 的 随机 系数 


在 前 三 章 中 我 们 已 经 示范 了 如 何 用 两 层 模型 来 表示 一 系列 心理 学 、 社 会 学 
和 教育 方面 的 现象 。 本 章 将 介绍 三 层 模型 ， 并 提供 几 个 近期 研究 的 示例 。 


制定 和 检验 三 层 模型 


为 了 交代 得 更 为 清楚 ， 我 们 将 在 一 个 具体 问题 的 情境 之 下 来 介绍 三 层 模型 ， 
即 一 套 有 着 三 层 结构 的 截面 数据 ， 包 括 学 生 ( 层 -1) RETHA (2-2), FHE 
REFER ( 层 -3)。 其 他 一 些 常见 的 、 三 层 的 截面 例子 还 包括 个 人 从 属于 户 ， 再 
从 属于 某 一 地 区 ; 或 个 人 从 属于 公司 ， 再 从 属于 不 同 的 行业 。 具 有 三 层 的 历时 应 
用 研究 模型 将 在 下 一 节 讨论 ， 然 后 讨论 关于 潜在 变量 的 应 用 研究 。 


完全 无 条 件 模型 


最 简单 的 三 层 模型 是 完全 无 条 件 的 模型 ， 即 任何 一 层 中 都 不 定义 自 变量 。 
这 样 一 个 模型 代表 着 测量 结果 的 变 差 是 如 何在 三 个 不 同 层次 (学生 、 班 级 、 
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学 校 ) 中 分 配 的 。 
学 生 层次 的 模型 。 我 们 将 每 个 学 生 的 学 业 成 绩 建 模 为 这 样 一 个 函数 ， 即 所 


属 班级 的 平均 数 加 上 一 个 随机 误差 ; 


Yu = ty + Ca : [8.1] 


其 中 ; 

yu 是 学 校 上 中 班级 的 学 生 守 的 成 绩 ; 

Tu 是 学 校 上 中 班级 的 平均 成 绩 ; 

en 是 一 个 随机 的 “学 生效 应 ”"， 凤 学 生 ake 的 成 绩 距 班 级 平均 数 的 册 差 。 
我 们 假定 这 些 效应 为 下 态 分 布 并 有 平均 数 等 于 0 和 方差 等 于 o, 
Fri, j, 大 代表 不 同 的 学 生 、 班 级 、 学 校 ， 其 中 ， 

1=1,2,… ,ns， 即 学 校 上 的 班级 j 中 的 各 个 学 生 ; 

j=1,2,… ,J 儿 ， 即 学 校 上 的 各 个 班级 ; 

k=1,2, = , KK， 即 各 学 校 。 

班级 层次 的 模型 。 我 们 将 每 个 班级 的 平均 成 顷 ro* 视 为 围绕 所 在 学 校 的 平 
均 成 绩 随 机 变化 的 结果 ; 


Moa = Boor + rm (8.2) 


其 中 : 

Bt 是 学 校 上 的 平均 成 绩 ; 

rm 是 一 个 随机 的 “班级 效应 ”， 即 班级 庆 的 平均 成 绩 距 所 在 学 校 平均 数 的 
离 差 。 我 们 假定 这 些 效应 为 正 态 分 布 并 有 平均 数 等 于 0 MRS FL, EK 
个 学 校 的 每 一 个 中 ， 都 假定 班级 之 间 的 变异 性 相同 。 


学 校 层次 的 模型 。 层 -3 模型 代表 了 学 校 之 间 的 变异 性 。 我 们 将 学 校 的 平 
均 成 绩 Bw 视 为 围绕 总 平均 成 绩 随机 变化 : 


Boow = Yooo + Yon (8.3) 


其 中 : 

?yom 是 总 平均 成 绩 ; 

to 是 一 个 随机 的 “学 校 效 应 ”， 即 学 校 上 的 平均 成 绩 距 总 平均 成 绩 的 离 
差 。 假 定 这 些 效应 为 正 态 分 布 并 有 平均 数 等 于 0 和 方差 等 于 res 
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方差 分 解 与 可 靠 性 

这 一 简单 的 三 层 模型 将 结果 7,, 的 总 差异 分 解 为 三 个 部 分 :( 层 -1) 同班 
级 之 内 的 学 生 之 间 的 差异 o; (HE -2) 同学 校 中 不 同班 级 之 间 的 差异 7,; 
(hE -3) 学 校 之 问 的 差异 rs。 我 们 还 可 以 估计 出 班级 内 的 、 同 学 校 班级 之 间 
的 以 及 学 校 之 间 的 差异 各 自 所 占 的 比例 ， 即 : 


同班 级 之 内 的 方差 比例 a`la +7, +7g) [8.4] 
同学 校 中 不 同班 级 之 间 的 方差 比例 1,/(o° +7, +T) [8.5] 
学 校 之 问 的 方差 比例 ty/(o +7, + Ty) [8.6] 


如 同 两 层 模型 一 样 ， 我 们 也 能 检查 最 小 二 乘法 所 估计 的 系数 的 可 靠 忻 。 然 
而 ， 现 在 需要 对 两 个 层次 的 可 靠 性 进行 估计 ， 即 班级 的 7 和 学 校 的 Buoe。 对 
于 层 -2 的 每 一 个 班级 从 ， 


reliability( ra) = 7,/[ 7, + 0° /ny | [8.7] 


是 班级 样本 平均 数 的 可 靠 性 ， 用 以 鉴别 同 校 之 内 的 各 班级 。 对 于 层 - 3 的 某 一 
FR, 


Ta 


7, +{ Ein, TOS 





reliability( u) = [8.8] 


是 学 校 样本 平均 数 的 可 靠 性 ， 作 为 其 平均 数 真 值 的 估计 。 
所 有 班级 的 可 靠 性 (方程 8.7) 的 平均 数 和 所 有 学 校 的 可 靠 性 (方程 
8.8) 的 平均 数 可 以 被 分 别 视 为 班级 和 学 校 平 均 数 的 可 靠 性 的 概括 性 指标 。 


条 件 模型 


完全 无 条 件 模型 的 方程 8. 1 ~ 8. 3 可 以 用 来 估计 与 三 个 层次 即 学 生 、 班 级 
和 学 校 相连 的 变异 性 。 可 想 而 知 ， 每 一 层次 变异 性 中 的 一 部 分 可 以 由 该 层 所 测 
量 的 变量 来 加 以 解释 。 也 就 是 说 ， 学 生 的 背景 特征 、 班 级 的 特征 和 学 校 的 特征 
都 可 以 作为 解释 变量 。 此 外 ， 在 班级 和 学 校 层次 的 一 些 关系 也 可 以 在 这 些 单位 
之 间 随 机 变化 。 比 如 ， 班 级 内 学 生 的 性 别 与 学 业 成 绩 有 关 。 这 一 性 别 差异 的 幅 
度 也 许 依赖 于 某 些 老师 的 特征 ( 如 教师 的 期 望 或 班级 组 织 的 方法 )。 在 这 种 情 
况 下 ,代表 性 别 效应 的 回归 系数 也 许 会 随 着 教师 和 班级 的 特征 而 变化 。 
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与 此 类 似 ， 学 校 层次 的 回归 系数 也 可 能 有 随机 变化 。 学 校 的 截 距 尤其 可 能 
是 随机 的 ， 而 回归 斜率 也 可 能 存 学 校 之 间 有 所 不 同 。 比 如 ， 学 生 的 社会 阶层 对 
学 业 的 效应 可 能 随 所 在 学 校 的 不 同 而 不 同 。 这 些 可 能 性 都 训 励 我 们 对 每 一 层次 
建立 一 个 一 般 性 的 结构 模型 . 

一 般 性 层 -1 模 型， 在 每 个 班级 内 ， 我 们 将 学 生 的 成 绩 作为 学 生 层次 的 自 
变量 的 函数 再 加 上 一 个 学 生 层 次 的 随机 误差 


Ya = Toye + Tuan + Wray + + Taaa + Cy {8.9] 


其 中 : 

Vi RFR k PHR AEA 的 成 绩 ， 

zu 是 学 校 上 中 班级 的 截 距 ; 

ma 是 p=1，…，P 个 学 生 的 特征 ， 用 以 解释 其 成 绩 ; 

mm 是 相应 的 层 -1 系数 ， 表 示 每 个 学 生 的 特征 a, 与 班级 扩 的 成 绩 之 间 的 
联系 方向 与 强度 ; 

ex 是 层 -1 的 随机 效应 ， 代 表 学 生 ijk 的 成 绩 与 其 基于 学 生 层次 模型 的 预 
测 值 之 间 的 误差 。 我 们 假定 这 些 学 生效 应 残 差 为 正 态 分 布 并 有 平均 数 等 于 0 和 
方差 等 于 o’, 

一 般 性 层 -2 模型 。 学 生 层 次 模型 中 的 每 个 回归 系数 (包括 截 距 ) 都 可 以 
被 视 为 或 是 固定 的 、 非 随机 变化 的 ， 或 是 随机 变化 的 。 这 些 可 能 性 导致 以 下 对 
同学 校 中 不 同班 级 之 间 差 异 所 建立 的 一 般 性 模型 。 对 每 一 班级 效应 rw ， 有 : 


Op 
Ta = Bor + BBXo, + rs {8.10] 


其 中 : 
Bm 是 所 建 班级 效应 ru 的 模型 中 关于 学 校 上 的 截 距 ; 

Au 是 班级 效应 rm 的 模型 中 作为 自 变 量 的 班级 特征 〈 注 意 ， 每 一 m, 可 能 
有 一 套 独 特 的 层 -2 变量 Xw，9 =1，…，0,); 

xu 是 相应 的 系数 ， 代 表 班 级 特征 与 rm 之 间 的 联系 方向 与 强度 ; 

rm 是 层 ~2 随机 效应 ， 代 表 班 级 关 的 层 -1 系数 rw 与 其 基于 班级 层次 模 
型 的 预测 值 之 间 的 误差 。 


ES, EZ -2 模型 中 有 P+1 个 公式 : 一 一 对 应 着 每 一 个 层 ~1 系数 。 假 
定 这 些 公式 中 的 随机 效应 是 相关 的 。 正 规 地 说 ， 我 们 假定 这 一 套 ,为 多 元 正 
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态 分 布 ， 且 其 中 的 每 一 维 都 有 平均 值 等 于 0、 方差 为 特定 的 7,,、 各 元 素 ry 与 
ri 之 间 的 协 方差 为 特定 的 7,, 。 我 们 将 这 些 方差 和 协 方差 收集 于 一 个 矩阵 之 
中 ， 标 志 为 T,， 它 的 维度 取决 于 设置 为 随机 的 层 - 1 系数 的 数目 。 例 如 ， 如 
果 一 个 班级 效应 ra 被 设置 为 固定 的 ， 那 么 方程 8. 10 中 便 没 有 对 应 那 项 效应 的 
层 -2 自 变 量 ， 于 是 相应 的 rw 就 被 设置 为 0。 如 果 rw 被 定义 为 非 随机 变化 的 ， 
会 出 现 半 变量， 但 必 仍 然 被 设置 为 0。 

一 般 性 层 -3 模型 。 对 学 校 层 次 的 建 模 过 程 仍 重复 类 似 的 过 程 。 每 一 层 -3 

“结果 ”( 即 每 一 B,, 系 数 ) 都 可 以 用 一 些 学 校 层次 的 特征 加 以 预测 ， 即 ; 


Bs — [8. 11) 
其 中 : 
ywm 是 求 Bw 的 学 校 层次 模型 中 的 截 距 项 ; 
WW 是 学 校 特征 ， 在 求学 校 效 应 B 时 用 作 自 变量 (注意 ,每 一 B, 可 以 有 
一 套 独 特 的 层 -3 自 变 量 Wi, s=1, 0, Su); 


Ym 是 相应 的 层 -3 系数 ， 代 表 学 校 特征 WW 与 Bu 之 间 的 联系 方向 和 强度 ; 
uv 是 层 -3 的 随机 效应 ， 代 表 学 校 上 的 系数 B,,, 与 其 基于 学 校 层次 模型 的 
预测 值 之 间 的 误差 。 


注意 ,在 层 -3 模型 中 对 于 每 一 个 学 校 都 有 2?.。( 0, + 1) 个 方程 。 这 些 方 
程 的 残 差 都 假定 为 多 元 正 态 分 布 ， 并 假定 每 一 个 都 有 平均 数 为 0， 各 对 元 素 之 
间 有 特定 的 方差 和 协 方差 。 这 些 方差 和 协 方差 也 被 收集 于 一 个 矩阵 之 中 ， 标 志 
为 Te。 Te 的 维度 取决 于 层 -2 系数 中 定义 为 随机 的 数目 。 正 如 层 -2 模型 的 7 
系数 一 样 ， 在 层 -3 模型 中 每 -个 8 系数 (包括 截 距 ) 都 可 以 设 定 为 固定 的 、 
非 随机 变化 的 ,或 随机 变化 的 ， 如 果 B,, 被 定义 为 固定 的 或 是 非 随机 变化 的 ， 
相应 的 u,w 便 假定 为 0。 


多 种 可 能 的 普 代 模型 


在 完全 无 条 件 模型 的 方程 8. 1 ~ 8. 3 与 完全 的 三 层 模型 的 方程 8.9 ~ 8. 11 
之 间 ， 存 在 许多 可 能 的 替代 公式 。 如 果 将 自 变量 纳入 层 -1 模型 ， 并 定义 所 有 
相应 的 层 -2 和 层 -3 的 7 参数 为 随机 变化 ， 使 这 两 层 形成 无 条 件 模 型 ， 我 们 
便 得 到 一 个 随机 系数 模型 ， 其 中 r 参数 有 两 个 变化 来 源 ， 即 班级 和 学 校 。 
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我 们 也 可 以 定义 学 生 层 次 模型 的 截 距 是 随机 的 ， 学 生 层次 的 自 变 量 在 层 -2 
和 层 -3 有 固定 效应 。 如 果 学 生 层 次 的 自 变量 是 以 总 平均 数 对 中 的 〈 即 ou - 
a), WA ro 便 是 班级 钛 的 调整 的 平均 成 绩 ， 这 一 平均 成 绩 已 经 对 班级 之 间 
就 学 生 层次 自 变量 的 平均 差异 进行 了 调整 。 许 多 不 同 的 班级 和 学 校 变量 还 可 以 
被 分 别 纳 人 层 -2 和 层 -3 模型 ， 用 以 解释 这 些 调整 的 班级 平均 数 的 变化 。 

还 有 一 种 不 同 的 方法 是 ， 层 - 1 模型 中 不 含 任何 自 变量 。 也 就 是 说 , 层 -1 
模型 只 是 代表 个 人 围绕 班级 平均 数 的 变化 。 而 这 些 班级 平均 数 的 变异 的 解释 可 
以 完全 由 层 -2 和 层 - 3 的 建 模 完成 。 此 外 ， 一 些 被 纳入 层 - 2 模型 的 自 变 量 
又 可 以 在 随后 层 -3 模型 中 定义 为 随机 的 或 非 随机 变化 的 。 这 一 方法 将 在 后 面 
加 以 示范 。 

还 有 更 多 的 可 能 性 ， 但 我 们 不 可 能 一 一 加 以 示范 ， 甚 至 不 可 能 一 一 列 
举 。 在 最 一 般 的 情况 下 ， 应 用 三 层 模型 的 研究 可 以 选择 : (a) 在 每 一 层 纳 人 
自 变量 ( 即 在 每 一 层 定义 一 个 结构 模型 );(b) 决定 各 层 模型 中 的 结构 效应 
( 即 截 距 与 斜率 ) 究竟 定义 为 是 固定 的 ， 还 是 非 随 机 变化 的 ， 或 是 随机 变化 
的 ; (c) 定义 替代 模型 以 分 解 方 差 协 方差 分 量 ， 而 不 用 方程 8.9 ~ 8. 11 中 的 
假定 。 

就 以 上 最 后 一 点 而 言 ， 许 多 备 选 方案 都 能 取得 o* 、T, 和 T。， 这 取决 于 实 
际 研究 的 假设 ， 以 及 是 否 具备 用 以 估计 这 些 假设 所 要 求 的 模型 参数 的 数据 。 比 
如 ， 班 级 层次 效应 中 的 协 方差 在 K 个 学 校 中 有 不 同 的 结构 ， 也 就 是 说 ， 要 估计 
出 一 套 方差 均 方差 T,, ,k=1，…, KK; 或 者 层 -1 的 变异 也 可 以 在 班级 或 学 校 
之 间 方 差 不 齐 ， 比 如 ， 要 估计 出 一 亦 of, k=1, =, Ke AWAZ, ANEX 
得 越 复杂 ， 估 计 与 推断 所 需要 的 数据 量 就 起 大 。 


三 层 模 型 的 假设 检验 


二 层 模 型 的 假设 检验 与 第 3 章 介绍 的 两 层 模型 的 检验 程序 十 分 相似 。 简 而 
言 之 ,我 们 能 够 设立 并 检验 三 层 中 任意 一 层 的 关于 辕 定 效应 、 随 机 系数 和 方差 
协 方差 分 量 的 假设 。 对 每 一 类 型 的 假设 而 言 ， 既 有 单 参数 检验 的 方法 ， 也 有 多 
参数 检验 的 方法 。 

对 周 定 效 应 的 单 参 数 检验 有 助 于 研究 者 决定 哪 一 个 具体 参数 是 所 需要 
的 。 对 固定 效应 的 多 参数 检验 既 可 用 作 上 整体 检验 (omnibus tests) ， 也 可 用 于 
固定 效应 之 间 的 先 验 (priori) 比较 。 比 如 ,若是 学 校 是 按 类 别 (公立 的 、 
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夫 主 教 的 或 其 他 私立 的 ) 分 类 的 ， 那 么 就 需要 用 两 个 虚拟 变量 来 代表 。 整 体 
检验 便 是 同时 检验 这 两 个 虚拟 变量 的 效应 都 为 0。 如 果 不 能 拒绝 这 一 假设 ， 
那么 学 校 类 别 的 变量 可 以 从 模型 中 删 去 或 者 考虑 用 单 自由 度 的 比较 ， 比 如 
比较 私立 学 校 与 公立 学 校 之 间 是 否 有 差别 ， 或 比较 天 主教 学 校 与 其 他 私立 学 
校 之 间 是 否 有 差别 。 

对 层 -2 或 层 -3 的 方差 分 量 也 可 以 进行 单 参数 检验 。 也 就 是 说 ，T, 或 Ts 
的 任 一 对 角 线 元 素 都 可 以 被 假设 为 0。 对 方差 分 量 的 多 参数 检验 可 以 用 于 检验 两 
个 及 以 上 的 方差 分 量 ， 既 可 包括 层 -2 的 元 素 ， 也 可 包括 层 -3 的 元 素 。 比 如 ， 
一 个 模型 在 拟 合 时 允许 性 别 效应 和 社会 阶层 效应 在 层 - 2 (在 学 校内 的 班级 之 
间 ) 随机 变化 。 也 许 研究 人 员 想 知道 ， 是 否 一 个 较 简单 的 模型 (假定 这 两 个 变 
量 的 效应 在 同一 学 校内 的 各 班级 中 相同 ) 就 足够 了 。 要 检验 这 个 假设 ， 研 究 人 
员 需 要 重新 估计 这 个 模型 ， 但 现在 要 固定 性 别 效应 和 社会 阶层 效应 。 如 第 3 章 曾 
讨论 过 的 ， 限 制 性 模型 (将 学 校内 的 性 别 和 社会 阶层 的 斜率 固定 化 ) 与 更 一 般 
的 替代 模型 〈 即 随机 斜率 模型 ) 的 偏离 度 统计 的 比较 就 是 用 似 然 比 检验 。 


例子 : 对 教学 的 研究 


这 一 示范 基于 来 自 美国 14 个 学 校 的 57 个 高 中 数学 教师 的 数据 (Rauden- 
bush, Rowan, & Cheong, 1991) 2 这 些 教师 平均 每 天 被 安排 教 4 堂 数学 课 。 这 
些 教师 的 目标 在 不 同班 级 有 所 不 同 。Raudenbush 及 其 同事 所 关注 的 是 每 一 教 
师 对 高 级 思维 方式 (higher order thinking, ， 简 标 为 HOT) 的 强调 程度 。 要 求 每 
个 教师 对 每 一 堂 课 都 要 回答 一 个 4 项 量度 测量 ， 代 表 了 对 证 明 结 构 、 代 数 式 、 
数学 计算 背后 的 推理 要 点 的 强调 程度 。 基于 这 4 WR EWR, BHT HOT 
指标 。 这 里 ， 层 -1 单位 是 班级 ， 层 -2 单位 是 教师 ， 层 -3 单位 是 学 校 。 

我 们 考虑 用 由 方程 8. 1 、8. 2 和 8.3 构成 的 完全 无 条 件 模型 ， 其 中 ， 


Ya EFE k PAI j 的 班级 ;的 HOT 指标 值 ; 
To 是 教师 站 的 HOT 指标 平均 数 ; 

Boos EFEX k HY HOT 平均 数 ; 
yem 是 总 平均 数 。 


D 感谢 斯 坦 想 大 学 中 学 教学 情景 研究 中 心 (由 美国 教育 部 教育 研究 与 改革 办 公 室 资 助 ， 合 约 
No. OERI ~ G0089C235) 允许 我 们 使 用 这 些 数据 。 
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结果 。 在 完全 无 条 件 模型 中 ， 只 有 一 个 固定 效应 yw。， 它 在 本 研究 中 的 意义 
是 所 有 班级 平均 数 的 平均 数 。 对 于 HOT 数据 ， 有 Yow = - 0.252, t= -0.959 
(参见 表 8.1)。 如 期 望 的 那样 ， 班 级 HOT 值 的 总 平均 数 距 期 望 结果 0 的 差异 不 
显著 ， 因 为 这 一 量度 已 经 标准 化 了 ， 有 平均 数 为 0。 


R81 对 HOT 数据 的 三 层 分 析 (完全 无 条 件 模型 ) 











国定 效应 系数 标准 误 se :比率 
“FN OFM, Yon 9.252 0. 262 = 0.959 
随机 效应 方差 分 最 Fi rR AE df x pt 
Ez UR -1), da 5 “5.85 E a g 
教师 ( 层 -2) roa 3.11 56 195.2 0. 000 
学 校 《 层 -3) ，uo 0.01 13 11.7 >0. 500 
方差 分 解 〈 按 层 的 百分比 ) 
H- 65.2 
B -2 34.7 
B -3 0.1 


在 方差 分 解 方面 , o” = Var (ep) 是 各 教师 在 不 同班 级 的 方差 ， 
Te =Var (rot) 为 同一 学 校 中 教师 之 间 的 方差 ，re = Var (uo) 是 学 校 之 间 的 
方差 。 将 这 些 方差 分 量 的 估计 值 代入 方程 8.4、8.5 和 8.6， 便 得 到 了 ,方差 
分 布 在 每 一 层次 的 百分比 (参见 表 8.1 中 的 第 三 部 分 )。 最 大 的 百分比 
(65.2%) 存在 于 同一 教师 教学 的 不 同班 级 之 间 ( 即 层 -1 中 ); 也 很 显著 但 
值 稍 小 的 百分比 (34.7%) 存在 于 同一 学 校 的 不 同 教师 之 间 (ME -2 中 ); 
只 有 很 小 比例 (0.1%) 存在 于 学 校 之 间 (BE -3 中 )。 教 师 之 间 的 差异 统 
计 性 显著 ， Ay’ =195. 2， 自 由 度 df =56 ( 相应 p <0.001); 但 是 学 校 之 间 
的 方差 统计 性 不 显著 ， 有 x =11.7， 自 由 度 df =13 (相应 p >0.500)。 

这 些 结果 表明 ， 教 师 倾向 于 对 不 同 的 数学 课 修改 他 们 的 目标 要 求 。 因 此 ， 
Raudenbush 等 人 (1991) 制定 了 一 个 层 -1 模型 来 预测 HOT 值 : 


Ya = mop + ma( TRACK) y + en [8.12] 


其 中 ，(TRACK)i 测 量 各 班 的 情况 或 水 平 ， 对 职业 教育 班 和 一 般 的 班 赋 值 为 -1， 
对 专业 班 赋值 为 0， 对 专业 重点 班 赋值 为 1 (这 种 对 比 编码 看 起 来 已 能 充分 捕 提 
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了 这 -种 类 型 之 间 的 差异 ) moa 和 7 都 被 设 为 在 教师 和 学 校 之 间 随 机 变化 ,但 
是 并 未 被 教师 或 学 校 层次 的 变量 所 预测 。 于 是 ， 层 -2 模型 为 : 

[8. 13a] 
[8. 13b] 


Tog = Bow + Tos 


Tig = Bye + hie 
注意 ， 层 -2 有 了 两 个 随机 效应 ， 其 结果 是 T, 为 一 个 2 x2 的 和 矩阵。 在 层 -3， 有 : 


Boa = Yooo + Mons [8. 14a] 
Bius = Yim + tioa [8. 14b] 


其 中 也 有 两 个 随机 效应 ， 并 且 T 为 一 个 2 x2 的 矩阵 。 这 些 结果 (这 里 未 提 
供 ) 说 明 HOT 指标 与 班级 情况 密切 相关 。 也 就 是 说 ，7iw 是 个 很 大 的 、 显 
著 的 正 效应 。 这 意味 着 ， 教 师 很 可 能 在 学 生 水 平 较 高 的 班级 上 更 为 强调 高 级 
思维 方式 。 然 而 ， 这 一 情况 的 效应 幅度 ,在 不 同 教师 之 间 有 所 不 同 。 也 就 
是 说 , fn = Var (yy) 显著 地 大 于 0。 与 此 相反 ， 这 些 班级 效应 在 学 校 之 间 
并 没有 变化 迹象 。 也 就 是 说 ，ra = Var (uw) =0 的 假设 可 以 保留。 

下 一 步 分 析 是 在 层 - 1 模型 中 引 和 人 班级 层次 的 自 变量 ( 比如 年 级 、 前 修 数 
学 课 类 型 ) ， 在 层 -2 模型 中 引信 教师 层次 的 自 变量 (如 教育 程度 、 数 学 水 平 、 
教学 经 历 ) 。 我 们 假设 教师 变量 能 够 对 教师 的 HOT 平均 数 rw 及 其 对 学 生 水 平 
较 高 的 班级 强调 高 级 思维 方式 的 倾向 ru 做 出 解释 。 

由 于 涉及 的 学 校 数目 很 少 ， 并 且 学 校 之 间 的 差异 并 不 明显 ， 就 没有 在 层 -3 
模型 中 定义 自 变量 。 实 际 上 ， 根 据 学 校 层次 在 Bu 或 Bw 上 都 很 少 有 差异 ， 可 以 
考虑 建立 更 简单 的 两 层 模型 了 ， 只 分 析 层 - 1 的 班级 和 层 -2 的 教师 ， 省 略 对 
学 校 的 分 析 。 


研究 组 织 内 的 个 人 变化 


教育 研究 的 一 个 基本 现象 是 个 人 学 习 在 班级 和 学 校 的 组 织 情境 中 的 增长 过 
程 。 为 了 研究 嵌 套 于 学 校 的 学 生 的 学 习 增 长 ， 我 们 将 第 5 章 对 炭 套 于 组 织 的 个 
人 建 模 方法 和 第 6 章 对 个 人 的 历时 变化 的 建 模 方法 结合 起 来 。 个 人 的 增长 轨迹 
由 层 ~1 模型 反映 ; 同一 学 校 的 学 生 之 间 在 增长 参数 上 的 差别 用 层 -2 模型 来 
表示 ; 学 校 之 间 的 差别 由 层 -3 模型 来 代表 。 

Bryk 和 Raudenbush (1988) 用 持续 效应 研究 ( Sustaining Effects Study) 
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(Carter, 1984) 0 所 得 的 历时 数据 的 一 个 再 抽样 的 小 样本 示范 了 这 一 研究 。 数 
据 中 包含 了 来 自 86 所 学 校 的 618 名 学 生 ， 对 每 一 个 学 生 都 在 一 年 级 春季 至 三 
年 级 春季 期 间 做 了 5 次 测量 


无 条 件 模型 


我 们 从 层 -1 的 个 人 学 业 增 长 模型 着 手 ， 其 中 反映 了 学 校 j 的 学 生 i 在 时 
间 + 上 的 学 业 情况 : 


Y,, = may + ms( ACADEMIC YEAR), + m, (SUMMER PERIOD),, +e, [8.15] 


其 中 ; 

8 是 学 校 j 的 学 生 i 在 时 间 :上 的 学 业 结果 ; 

(ACADEMIC YEAR), 在 一 年 级 春季 和 二 年 级 秋季 时 赋值 为 0， 在 二 年 级 
春季 和 三 年 级 秋季 时 赋值 为 1， 在 三 年 级 春季 时 赋值 为 2; 

(SUMMER PERIOD), 在 一 年 级 春季 时 赋值 为 0， 在 二 年 级 秋季 和 春季 时 
赋值 为 1， 在 三 年 级 秋季 和 春季 时 赋值 为 2; 

7Toy 是 学 生 当 的 初始 状况 ， 即 这 一 学 生 在 一 年 级 春季 时 的 期 望 成 绩 (这 时 
有 ACADEMIC YEAR =0 和 SUMMER PERIOD =0) ; 

m TEREM E ij AE ROR, 

Tuw 是 学 生 妆 在 暑期 中 的 数学 学 习 效率 。 


初步 分 析 的 结果 表明 ，ro Ar, 在 层 -2 和 层 -3 中 都 有 很 大 的 随机 变化 。 
然而 ， 学 生 层 次 的 rw 的 可 车 性 却 小 于 0.02， 虚 无 假设 7,,, =0 不 能 被 拒绝 。 
(还 注意 到 这 一 模型 迭代 了 1000 次 才 取 得 收敛 1) 在 学 校 层 次 ，rx 的 可 车 性 约 
为 0. 20， 相 应 的 虚无 假设 rw; =O 勉强 显著 。 此 外 ， 在 mros 和 7,y 之 间 存 在 很 强 
的 负 相关 (高 于 -0.90) 。 鉴 于 学 校 样本 量 (J = 86) 不 大 ， 这 些 结果 建议 我 
们 在 层 - ! 模型 中 保留 ry, BEE -2 和 层 -3 中 将 其 视 为 固定 的 。 就 形式 而 
言 ，SUMMER PERIOD 在 层 -1 模型 中 是 个 随时 间 变 化 的 协 变量 ， 而 在 层 -2 
和 层 -3 的 效应 是 固定 的 。 

具体 地 说 ， 在 层 -2， 有 : 


山 这 里 革 现 的 结果 与 其 初次 发 表 时 有 所 不 同 (Bryk & Raudenbush，1988) 。 因 为 这 里 对 层 -1 自 
空 量 采 用 了 不 同 的 编码 方法 ， 所 以 这 样 能 更 为 直接 地 代表 研究 的 初 襄 


并 且 在 层 -3 有 : 


Toy = Bro; + Toy 


Tiy = Biy + rs 


Ty = By, 


Boo, = Yooo + Uoo; 


Bios = yio + Uig 


Ba, = Yw 
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8. 16a] 
8. 16b] 
8. 16c] 


[8. 17a] 
8. 17b) 
8. 17c] 





注意 ，Bow 代 表 学 校 j 的 平均 初始 状况 ， 而 yom 是 初始 状况 的 总 平均 数 ; By EF 
校 j 的 平均 学 年 学 习 效 率 ， 而 yw 是 总 平均 的 学 年 学 习 效 率 ; By RFR HW 
SUMMER PERIOD 的 效应 ， 我 们 假定 其 对 所 有 学 校 是 相同 的 水 平 yx ， 所 以 是 


个 固定 的 暑期 学 习 效应 。 


结果 。 表 8. 2 提供 的 结果 表明 ， 正 如 所 期 望 的 那样 ， 对 所 有 的 学 生 和 学 校 取 
平均 以 后 ， 存 在 一 个 总 的 正 增长 轨迹 。 估 计 的 初始 状况 YX.w 为 403. 685。 每 一 学 
年 的 平均 学 习 效率 估计 为 56.537 ( 即 yw)。 但 是 在 暑期 SUMMER PERIOD 中 ， 


学 生 的 平均 学 习 效率 实际 上 是 0 (BD yam =0. 272， 统 计 性 不 显著 ) 。 


表 8.2 对 持续 效应 研究 数据 的 三 层 分 析 (在 层 -2 MM -3 的 完全 无 条 件 模型 ) 








固定 效应 系数 BRIER se 
初始 状况 的 总 平均 数 ， Yoo 403. 685 2. 054 
平均 学 年 学 习 效 率 ，Yio 56. 537 1.411 
平均 茵 期 学 习 效率 ，Yoo 0.272 0.096 
随机 效应 BHM 自由 度 of x 
“el 
时 间 变 异 ，ew 600. 112 
层 -2 (FRM) 
个 人 搜 始 状况 rog 1127. 633 532 2536.8 
个 人 学 年 学 习 效 率 ,， r,s 48. 970 532 695.9 
层 -3 (学 校 之 间 ) 
学 校 平均 的 初始 状况 uo 98. 546 85 126.7 
学 校 平均 的 学 习 效 率 ，wo 68, 568 85 221.7 
层 -上 系数 学 校 之 间 的 方差 比例 


+ 比率 
196. 516 


40.095 
0. 283 
p tii 


0. 000 
0. 000 


0. 002 
0. 000 
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续 表 8.2 


初始 状况 ，mov 8.0 
FARR, my, 58.3 
Ji KiB Wy HS Sp WR MINE -2 与 层 -3 随机 效应 之 间 的 相关 


1127.633 0.236) 。 Fat 
( 55.478 ‘aye -| ) 





Tan Tan 


98.546 0.361, . Tm 
ii -3 ) =T,= 
29.697 68. 568 Th îm 





注 : 矩阵 对 角 线 下 的 元 素 为 协 方 益 ; 耐 对 角 线 上 的 元 素 为 相关 系数 。 


这 一 研究 实际 关注 的 是 将 ro 和 ,的 方差 分 别 分 解 为 学 校内 和 学 校 间 的 
分 量 。 这 些 方差 分 量 的 估计 在 表 8. 2 中 的 第 二 部 分 。 这 些 方差 分 基 的 x 统计 
表明 ， 同 学 校内 学 生 在 初始 状况 和 学 年 学 习 效 率 ( 即 Ty AM my) 上 的 差异 显 
著 ， 并 且 学 校 之 间 在 平均 初始 状况 和 平均 学 年 学 习 效率 ( 即 Bw 和 piw) LH 
异 也 显著 。 

在 这 些 方差 分 量 估计 的 基础 上 ， 我 们 还 可 以 计算 学 校 之 间 在 初始 状况 和 学 
习 效 率 上 所 占 差异 的 百分比 。 其 公式 为 ; 

学 校 之 间 在 ny 方差 上 占 的 百分比 = 一 名- [8.18] 


ov * Topp 


其 中 , P=1,…,P。 在 这 种 情况 下 , p=0, 1。 将 相应 方差 分 量 估计 代入 方程 
8. 18， 可 得 到 表 8. 2 中 第 三 部 分 的 结果 。 我 们 发 现 ， 大 约 8.0% 的 初始 状况 方 
差 存 在 于 学 校 之 间 。 这 一 结果 比 应 用 截面 研究 中 的 学 校 效应 值 略 小 ， 因 为 截面 
研究 中 学 校 效 应 通常 占 成 绩 差异 中 的 10% ~ 30 为 之 间 。 然 而 ， 学 习 效 率 的 结 
果 是 惊人 的 ， 近 60 旬 的 方差 存在 于 学 校 之 间 。 

研究 还 关注 将 初始 状况 和 学 年 学 习 效 率 之 间 的 相关 分 解 为 学 校 之 内 
( 层 -2) 和 学 校 之 间 ( 层 -3) 的 分 量 (参见 表 8. 2 中 最 下 面 的 部 分 )。 在 典 
型 的 社会 经 济 状况 的 学 校 之 内 ， 估 计 的 相关 为 0.236。 然 而 在 学 校 层次 上 这 一 
关联 略 强 一 些 ， 为 0. 361。 我 们 注意 到 ， 在 其 他 研究 中 这 一 联系 的 分 解 能 够 导 
致 非常 不 同 的 关联 估计 ， 包 括 在 一 个 层次 上 可 能 为 正 相 关 ， 而 在 另 一 个 层次 上 
却 是 负 相 关 。 

总 之 ,无 条 件 的 层 -2 和 层 - 3 模型 应 该 在 这 两 层 中 尚未 考虑 解释 性 模型 
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之 前 进行 拟 合 。 这 种 无 条 件 模型 可 以 提供 研究 个 人 增长 的 重要 统计 ， 包 括 : 将 
个 人 增长 参数 的 变异 性 划分 为 层 -2 和 层 -3 分 量 ; 增长 参数 之 间 的 相关 性 ; 
以 前 每 一 层次 效应 的 可 靠 性 (如 方程 8.7 和 8.8)。 

在 这 一 特定 应 用 中 ， 方 差分 量 的 分 解 凸显 出 这 种 数据 的 一 个 重要 特征 ， 即 
学 习 效 率 的 大 部 分 变异 存在 于 学 校 之 间 。 可 靠 性 估计 还 有 助 于 我 们 识别 层 -2 
和 层 -3 模型 中 是 否 有 革 些 随机 效应 可 以 被 设置 为 0。 


条 件 模型 


现在 我 们 来 考虑 一 个 解释 性 模型 ， 其 中 考虑 学 生 贫困 与 学 校 贫困 对 个 人 数 
学 成 绩 的 影响 。 层 -1 模型 仍 按 方程 8. 15 那样 定义 ， 层 -2 模型 代表 了 每 个 增 
长 参数 rm 在 同学 校 学 生 之 间 的 差异 。 变 量 学 生 贫 困 的 效应 将 在 这 里 表示 出 来 。 
具体 而 言 ， 我 们 定义 了 以 下 层 -2 模型 ; 


Toy = Boy + Boy (FER), + mm [8. 19a) 
Ty = Bio + By, FERH), + rw [8. 19b] 
Tr = Bry (8. 196) 


我 们 假设 ， 在 方程 8. 19a 和 8. 19b 中 ， 学 生 贫困 (为 虚拟 变量 ， 表 示 此 学 
生 是 否 来 自 贫困 家 庭 ) 与 初始 状况 和 学 习 效 率 有 关 。 方 程 8. 19e 定义 暑期 效应 
对 每 一 学 校 /之 内 的 所 有 学 生 相 同 。 由 于 学 生 贫 困 是 一 个 虚拟 变量 ， 相 应 的 回 
归 系 数 可 以 解释 为 贫困 差别 的 效应 。 也 就 是 说 ，Bo, 是 贫困 差别 对 同学 校 学 生 
初始 状况 的 影响 ( 即 从 贫困 学 生 比 其 他 学 生 的 后 进程 度 ) ，B,v 是 贫困 差别 对 同 
学 校 学 生 学 习 效率 的 影响 (就 两 组 学 生 在 随后 学 习 效率 上 的 差别 ) 。 

层 -3 模型 代表 了 学 校 之 间 在 5 个 及 系数 上 的 差异 。 我 们 在 这 一 示例 中 假 
设 ， 学 校 的 贫困 状况 影响 学 校 的 平均 初始 状况 和 学 习 效率 ， 并 且 在 所 有 学 校 中 
学 生 贫 困 对 初始 状况 的 影响 都 相同 ， 但 是 贫困 差别 对 学 习 效 率 的 作用 在 学 校 之 
间 不 同 ， 作 为 学 校 贫 困 状 况 的 函数 。 我 们 还 假设 ， 出 于 后 面 讨 论 的 原因 ， 学 校 
贫困 与 学 生 里 期 退步 的 幅度 有 关 。 于 是 ， 我 们 定义 了 下 面 的 层 -3 模型 


Boo, = 学 校 7 中 富裕 学 生 的 平均 初始 状况 
= Yaw + Yoo (FRE HFA), + tpg; [8. 20a] 
Bo, = 贫困 差别 对 初始 状况 的 影响 


= Yow (8. 20b] 


230 RAED. 应 用 与 数据 分 析 方 法 


Bw = 学 校 了 中 富裕 学 生 的 学 年 学 习 效率 


= yoo + Yoon PRA), + uin [8. 20c) 
Ba, = ERU AE E R E R R E A BR A E 

= yuo + Ym ERRA), [8. 204] 
By, = FE P AI WH RUN 

= yam + Ym (学 校 贫 内 )， [8. 20e] 


注意 ， 每 一 学 校 有 两 个 随机 效应 : tg, 和 ww。 这 一 模型 估计 的 固定 效应 在 表 
8. 3 中 给 出 ， 


表 8.3 学 生 和 学 校 的 贫困 对 学 习 的 影响 { 对 持续 效应 研究 数据 的 三 层 分 析 ) 
国定 效应 系数 RRB se :比率 
初始 状况 的 模型 ， mo — 
HME OPM BARR HD. Bo, 








RUE Yow 414. 958 2.310 179. 599 

FERRI. Yo -0.457 0. 095 4. 818 
学 生 黄 办 差别 村 初始 状况 影响 的 模型 ，B, 

MF. Yow, -12.032 4.845 -2.484 


学 年 学 习 效 率 的 模型 ，7,， 
富裕 学 生 学 习 效率 的 模型 Bo 


RE, yiwo 60. 491 2. 123 28. 489 

RAM, Yio -0, 179 0. 080 -2.220 
学 生 贫 困 差 别 对 学 习 效 率 影响 的 模型 ，B 

RE, yio -8.215 4.134 ~ 1. 988 

FERRA, yn 0. 164 0. 099 1.655 


几 期 学 习 效 率 的 机 型， 
FRR HA, Bry, 

截 距 y2% ~ 2.309 1. 369 =1. 687 

SRAM, Yw 0. 132 0. 050 ` 2.652 





在 这 一 研究 中 ， 系 数 yw 代表 所 预测 的 在 富裕 学 校 〈 即 学 校 贫困 =0) 的 
“富裕 学 生 ”( 即 学 生 贫 困 =0) 的 初始 状况 。 对 于 这 样 的 学 生 ， 其 数学 成 绩 估 
计 为 414. 958 分 。 对 学 校 贫 困 集 中 度 上 的 每 一 10% 的 增 量 ， 期 望 初始 状况 会 减 
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> 4. 574 分 ( 即 10 xy )。 在 一 开始 收集 数据 的 时 点 上 ， 学 生 贫 困 差 别 yoo 为 
12. 032 分 。 这 说 明 来 自 贫 困 家 庭 的 学 生 ( 即 学 生 贫 困 = 1) 从 一 开始 就 落后 富 
裕 学 生 12. 032 Sh, 

富裕 学 校 的 富裕 学 生 的 学 年 党 习 效率 的 估计 值 yw 为 60.491 分 。 平 均 而 
言 ， 这 类 学 生 每 学 年 将 多 得 60 分 。 然 而 ， 富裕 学 生 的 学 习 效率 作为 学 校 贫困 
ERRER FE (Yi = -0.179)。 

对 一 个 在 富裕 学 校 的 贫困 学 生来 说 ， 学 年 学 习 效率 比 一 个 富裕 学 生 低 8. 215 
分 ( 即 7%)。 这 样 一 个 学 生 在 一 学 年 的 学 习 中 的 平均 效益 为 yo + ye = 
60. 491 -8.215 =52.276 分 。 学校 贫困 对 贫困 学 生 的 学 习 效 率 有 一 个 很 小 的 正 影 
响 。 在 调整 了 学 生 贫 困 程 度 以 后 ， 学 校 贫 困 集 中 度 上 10% 的 增加 预测 出 学 习 效 
率 上 有 1.64 分 的 增 量 ( 即 10 x yu ) 。 可 想 而 知 ， 在 这 一 分 析 中 学 校 贫困 只 是 对 
该 校 补偿 性 教育 资源 可 得 量 的 一 个 近似 而 已 ， 它 直接 依赖 于 学 校 的 贫困 程度 。 

学 校 贫困 效应 的 模式 还 表现 于 模型 中 的 对 期 效应 上 。 和 贫困 集中 度 较 高 的 学 
校 ， 便 会 有 较 多 人 参加 甘 期 学 习 。 比 如 ， 在 一 个 所 有 学 生 都 是 贫困 学 生 的 学 校 
CERRI = 100) 里 ， 期 望 轩 期 效应 将 为 yao + 100 x ya = - 2.309 + 
(0. 132) x100 =10.89。 尽 管 我 们 没有 各 学 校 具体 的 暑期 课程 数据 ， 我 们 也 知 
道 ， 总 的 来 说 ， 补 偿 性 基金 是 用 于 这 一 目的 。 于 是 ， 这 些 结果 表明 补偿 性 教育 
效应 可 能 影响 学 生 著 期 的 学 习 。 

表 8.4 展示 了 所 估计 的 三 个 层次 分 解 的 方差 和 有 关 的 统计 。 这 些 结果 
表明 ，rw 、7ruw 和 Bu 上 的 残 差 参 数 方差 还 能 进一步 解释 。 与 此 相反 ， 在 Bo 上 
的 残 差 方 差 已 经 没有 什么 解释 的 余地 了 (注意 其 不 显著 的 妇 Sit). 


表 8.4 学 生 和 学 校 的 贫困 对 学 习 的 影响 三 层 分 析 的 方差 分 解 








随机 效应 方差 分 量 A hE of x p ii 

层 -1 方 站 g 

HE, ey 597.67 
层 -2《 校 内 学 生 ) 

PAMER, ro; 1116. 30 531 3231.9 0. 000 

个 人 学 习 效 率 ,，r; 47.92 531 694. 50 0. 000 
层 -3 (学 校 之 间 ) 

学 校 平 均 状况 ，uom 2.72 84 87.01 0. 389 

学 校 平 均 学 习 效率 ，umw 68.72 84 223. 18 0.000 


偏差 度 Deviance =29932. 31 
乱 数 估计 的 个 数 = 16 
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对 层 -1 模型 的 另 一 种 编码 方法 。Bryk Al Raudenbush (1988) 原来 对 这 一 
数据 的 分 析 所 用 的 是 另 一 种 不 同 的 表示 学 校 j 的 学 生 i 在 时 间 +: 上 的 个 人 增长 
模型 : 


Ya = toy + Tg( 时 点 } + Tai( 团 期 退步 )，+ ey [8.21] 


其 中 : 

YoAJ 中 学生 i 在 时 间 上 上 的 成 绩 ; 

(时 点 ) 在 一 年 级 春季 时 赋值 为 0， 在 二 年 级 秋季 时 赋值 为 1， 在 二 年 级 
春季 时 赋值 为 2， 在 三 年 级 秋季 时 赋值 为 3， 在 三 年 级 春季 时 赋值 为 4; 

(PBS) ERK EM (即时 点 为 1 和 3 时 ) 赋值 为 1， 在 春季 时 点 上 赋值 
为 0; 

Tu 是 学 生 疾 的 初始 状况 ， 即 在 一 年 级 春季 时 (这 时 有 时 点 =0 和 里 期 退步 = 
0) 这 一 学 生 的 期 望 成 绩 ; 

Tu 是 学 生 站 每 一 学 期 的 学 习 效率 ; 

Ta 是 学 生 户 在 著 期 发 生 的 数学 成 绩 从 ri, 中 的 下 降幅 度 。 


按照 这 一 模型 ， 学 生 当 在 一 年 学 习 中 的 期 望 学 习 效 率 为 2 x RB my 
测量 了 学 生发 生 的 著 期 退步 。 作 为 结果 ，mri + rw 现在 是 暑期 的 期 望 学 习 效 
率 。 尽 管 方程 8. 21 的 结果 也 有 可 能 推出 方程 8. 15 的 模型 结果 ， 但 是 回顾 方程 
8. 15 对 这 一 问题 而 言 是 更 为 直接 的 模型 ， 因 为 一 年 的 学 习 过 程 被 直接 分 解 为 
一 整 学 年 和 署 期 效应 两 个 部 分 。 因 此 ， 它 们 可 以 被 再 用 作 结 果 变 量 分 别 继续 在 
层 -2 和 层 -3 建 模 。 现 在 我 们 再 用 一 个 示例 说 明 ， 如 何 根据 不 同 的 层 - 1 模 
型 发 展 出 一 个 更 能 说 明 问 题 的 整体 分 析 。 


层 -1 的 测量 模型 


如 前 所 述 ， 在 分 层 线 性 模型 中 层 -1 模型 总 是 可 以 被 看 作 是 测量 模型 。 我 们 
已 经 示范 了 在 组 织 效应 研究 中 层 - 1 系数 如 何 根据 组 织 内 许多 个 人 的 情况 来 测量 
组 织 的 特征 。 与 此 类 似 ， 在 增长 研究 中 ， 我 们 示范 了 层 -1 系数 如 何 根据 时 间 系 
列 数据 来 测量 个 人 增长 的 参数 。 现 在 ， 我 们 来 示范 如 何 将 层 - 1 模型 定义 为 一 个 
明确 的 测量 模型 ， 它 可 以 将 多 个 调查 项 目 结合 起 来 形成 一 个 总 的 量度 。 我 们 还 将 
示范 如 何 将 其 他 外 部 来 源 的 心理 测量 信息 结合 到 多 层次 的 模型 框架 中 来 。 
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例子 : 学 校 氛 围 的 研究 


组 织 氛 围 研究 经 常 是 基于 个 人 的 认 知 之 上 。 典 型 的 做 法 是 : 将 教师 或 学 生 
填报 的 一 些 调查 项 目 结合 起 来 ， 构 建 出 对 氛围 的 一 个 总 的 测量 指标 。 这 些 个 人 
的 测量 先 按 组 织 层次 汇总 ， 再 建立 一 个 总 的 氛 力 指标 。 然 而 问题 是 ， 氛 围 指 标 
在 个 人 层次 或 组 织 层次 也 许 会 有 不 同 的 意义 和 不 同 的 测量 性 质 。 由 于 各 层 的 测 
量 误差 程度 不 同 ， 相 关 程 度 将 被 削弱 ， 并 可 能 导致 研究 结果 难以 解释 。 可 以 应 
用 三 层 模型 来 解决 这 一 问题 。 我 们 通过 一 个 拥有 5 项 氛围 指标 的 例子 来 说 明 这 
一 方法 。 这 个 例子 来 自 教师 调查 所 得 到 的 5 个 变量 ， 包 括 主要 领导 、 同 事 合 
作 、 教 师 控制 、 教 师 功 效 以 及 教师 满意 度 。 

Raudenbush 、Rowan 和 Kang (1991) 分 析 了 一 套 来 自 110 个 学 校 的 1867 个 
教师 的 问卷 数据 。 这 一 数据 包括 35 个 里 氏 量度 项 目 ， 分 别 测量 了 5 个 潜在 构件 : 
主要 领导 、 同 事 合 作 、 教 师 控制 、 教 师 功效 以 及 教师 满意 度 。 研 究 目 的 是 检查 这 
些 指 标的 心理 测量 性 质 ， 并 且 研 究 学 校 特征 与 这 些 潜在 构件 之 间 的 结构 关系 。 

下 面 提供 了 无 条 件 模 型 分 析 的 有 关 结 果 。 这 一 模型 中 的 层 -1 代表 了 每 一 
教师 在 这 些 项 目 分 值 上 的 变异 ， 层 -2 代表 了 同一 学 校 中 不 同 教师 之 间 的 差 
异 ， 层 -3 代表 了 不 同学 校 之 间 的 差异 。 

层 -1 模型。 为 简单 起 见 ， 我 们 假定 测量 某 一 构件 的 各 个 项 目 具 有 相同 的 
权重 。 此 外 ， 在 层 -1 分 析 中 先 将 所 有 项 目 都 进行 了 标 化 ， 以 保证 它们 都 有 大 
致 相等 的 误差 方差 ,P 层 ~ 1 模型 为 ; 


Ys = DY ra + en [8.22] 
7 


其 中 : 
aa 当 项 目 i 测量 构件 P 时 赋值 为 1!， 在 其 他 情况 下 赋值 为 0, p=1, =, 5; 
ma 是 学 校 上 中 的 教师 j 在 构件 p 上 的 潜在 真 值 ; 
ea 是 误差 ， 假 定 其 为 正 态 分 布 ， 平均 数 为 0， 方 差 为 0?。 


中 每 一 构件 的 误差 方差 的 债 计 是 在 另 一 篇 分 析 中 完成 的 ， 参 见 Raudenbush 、Rowan 和 Kang 
(1991) 的 描述 。 用 wy 标志 构件 的 误差 方差 ， 然 后 所 有 项 目 按 100/0, 加 权 ， 重 新 加 权 的 数 
据 香 到 的 层 - 1 方差 为 10000。 
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假定 ej 为 正 态 分 布 对 一 般 情况 没有 什么 影响 ， 比 如 对 采用 里 氏 测 量 并 有 
着 比较 对 称 分 布 的 那些 项 目 (参见 第 10 章 中 所 讨论 的 对 序 次 数据 更 为 精细 的 
方法 )， 

层 -2 模型 。 层 -2 模型 描述 了 学 校内 部 不 同 教师 的 真 值 r, 的 分 布 : 


Toa = Bo + Typ [8.23] 


IEP, Bu ERE k TERE p 上 的 真 值 平 均 数 ，mm 是 具体 个 人 的 特殊 效应 。 对 
于 每 一 个 教师 的 5 个 随机 效应 rm,…,rsw， 假 定 其 为 多 元 正 态 分 布 ， 有 平均 数 
为 0 和 一 个 5 x5 的 协 方差 矩阵 T。 . 

屋 -3 模型 。 在 层 -3， 学 校 的 平均 分 围绕 总 平均 分 变化 : 


Be = Yoo + um [8.24] 


对 于 每 个 学 校 ， 假 定 随机 效应 ww,,… ,us 为 多 元 正 态 分 布 ， 有 平均 数 为 0 和 一 
个 5x5 的 协 方差 窍 阵 T,。 

结果 。 表 8.5 中 提供 了 有 关 结 果 。 固 定 效应 为 5 个 总 平均 数 。 这 个 表 还 提 
供 了 2 个 协 方差 矩阵 T。 AT, URE -1 的 方差 go* (注意 ， 在 这 两 个 矩阵 
中 ,方差 协 方差 呈现 在 对 角 线 以 下 ， 而 相应 的 相关 系数 则 列 在 对 角 线 以 上 ) 。 

结果 当中 最 有 趣 的 一 个 特点 是 ， 提 供 了 潜在 构件 之 间 的 相关 系数 。 比 如 ， 
在 教师 层次 ， 教 师 功效 与 教师 满意 度 之 间 (构件 4 和 5) 的 相关 估计 为 0. 98， 
表明 这 两 个 构件 实际 上 在 教师 层次 是 区 分 不 开 的 。 然 而 ， 这 一 含义 显然 不 同 于 
直接 检查 观测 分 的 相关 时 所 得 到 的 结论 。 这 种 对 比 结果 在 表 8.6 中 给 出 。 注 
意 ， 观 测 分 之 间 的 相关 系数 为 0. 56。 对 这 种 差别 的 解释 是 ， 在 建立 每 一 构件 
的 测量 时 只 用 2 个 项 目的 分 数 。 结 果 ， 电 于 用 的 项 目 太 少 ， 观 测 分 之 间 的 相关 
很 高 。 分 层 模 型 对 构件 真 值 之 间 的 相关 估计 大 于 在 教师 层次 和 学 校 层次 所 观测 
的 相关 ， 这 不 足 为 奇 。 


R85 心理 测量 分 析 








BER 系数 FER se + 比率 
主要 领导 的 平均 分 ，yim ~ 5.36 0.70 
间 事 合作 的 平均 分 ，yaoo 9.63 4.42 2.18 
教师 控制 的 平均 分 ，?om 14. 24 3.66 3, 89 


BEDAH, Yao 9. 65 3. 04 3.17 
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续 表 8.5 
教师 满意 度 的 平均 分 ，Yyoo 10. 79 4.05 2, 66 
层 -1、 层 -2、 层 -3 的 随机 效应 的 方差 协 方差 分 量 
以 及 层 -2、 层 -3 的 随机 效应 之 间 的 相关 系数 
i -1. a? =9979 
6052 0.615 0.5790. 578 0. 561 
3436 5156 0.3820. 5270. 531 
层 -2, T, =] 2324 1413 2660 0.5610, 468 
2964 2498 1909 4351 0.980 
4241 3709 2347 6285 9447 
2957 0.746 0.560 0.633 0.690 
1584 1694 0.605 0.709 0.734 
层 -3. T,=| 1000 862 1198 0.648 0.579 
694 621 478 453 0.898 
1077 915 607 579 916 
TE: 矩阵 对 角 线 下 的 元 素 为 协 方差 ; 面 对 角 线 上 的 元 素 为 相关 系数 。 
R86 各 个 层次 上 的 相关 
教师 层次 学 校 层次 
序 次 * 分 层 序 次 * 分 层 
主要 领导 “与 a 
同事 合作 0.57 0.62 小 68 0.75 
教师 控制 0.48 0.58 0.55 0.56 
教师 功效 0. 38 0.58 0.46 0. 63 
教师 满意 度 0.44 0.56 0.56 0.69 
同事 合作 “与 
教师 控制 0.35 0.38 0.52 0.61 
BIG HM 0.35 0.53 0.53 0.71 
教师 满意 度 0.41 0.53 0.63 0.73 
教师 控制 “与 
教师 功效 0.35 0. 56 0.51 0.65 
教师 满意 度 0.34 0.47 0.51 0. 58 
教师 功效 “与 
教师 满意 度 0.56 0.98 0.74 0.90 


注 : a 根据 教师 层次 观测 值 做 出 ， 忽 帖 学 校 所 属 情况 。 
b. 根据 学 校 平 均 数 做 出 -。 
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这 些 结果 还 显示 出 ， 这 两 个 层次 上 的 相关 结构 是 不 同 的 。 就 本 质 而 言 ， 三 
层 分 析 矫 正 了 相关 系数 中 的 测量 误差 ， 由 于 在 不 同 层 次 上 的 测量 误差 结构 差别 
很 大 ， 所 以 对 各 个 层次 的 矫正 也 是 不 同 的 。 在 教师 层次 ， 可 靠 性 依赖 于 量度 中 
包括 的 项 目的 数目 和 项 目 之 间 的 一 致 程度 。 在 学 校 层次 ， 虽 然 多 少 也 受 这 些 因 
素 的 影响 ,但 可 靠 性 更 依赖 于 每 个 学 校 所 抽取 的 教师 数量 和 学 校内 部 教师 之 间 
的 一 致 性 水 平 。 

Raudenbush, Rowan 和 Kang (1991) 还 通过 利用 教师 特征 (如 教育 和 社会 
背景 ) 和 学 校 特 征 ( 如 类 别 、 规 模 及 社会 构成 ) 扩展 了 这 一 分 析 ， 以 解释 潜在 
氛围 变量 中 的 变异 。 他 们 的 分 析 基 本 是 应 用 两 层 的 多 元 分 析 模 型 ( 即 对 校内 的 
教师 定义 了 多 个 潜在 氛围 构件 ) 。 这 种 解释 性 模型 有 助 于 研究 人 员 评 价 在 学 校 层 
次 和 教师 层次 上 影响 这 5 个 不 同 的 潜在 氛围 构件 的 自 变量 的 相对 强度 。 


例子 : 对 以 学 校 为 基础 的 职业 社区 及 其 促进 因素 的 研究 


Bryk, Camburn 和 Louis (1999) 分 析 了 芝加哥 学 校 协 会 收集 的 数据 ， 其 
中 包括 来 自 芝 加 和 再 的 248 个 小 学 的 5690 个 教师 的 资料 ， 以 评价 一 系列 结构 、 
人 文 、 社 会 因素 对 学 校 的 工作 场所 组 织 的 影响 。 所 关注 的 重点 结果 变量 是 以 学 
校 为 基础 的 职业 社区 情况 ， 它 由 调查 资料 推导 出 的 6 个 不 同 指标 (反应 对 话 、 
实践 刑 夺 、 同 事 合作 、 新 教师 社会 化 、 关 注 学 生 学 习 、 对 学 校 发 展 的 集体 责任 
感 ) 合成 。 这 6 个 指标 是 通过 拉 氏 量度 (Rasch rating scale) 分 析 建 立 起 来 的 
(Wright & Masters ,1982) ， 并 得 到 了 每 个 教师 在 6 个 指标 上 的 测量 值 及 其 标准 
误 。 由 于 并 不 是 所 有 教师 都 回答 了 所 有 调查 问 项 ， 因 此 在 分 析 中 考虑 测量 的 标 
准 误 上 的 差异 尤其 重要 。 此 外 ， 像 前 面 的 例子 一 样 ， 职 业 社 区 的 合成 测量 也 包 
含 在 教师 层次 和 学 校 层次 上 的 变异 分 量 及 其 自 变 量 。 这 一 研究 的 分 层 线性 模型 
的 基本 形式 在 下 面 给 出 。 有 关 这 一 研究 更 多 的 细节 和 研究 结果 ， 参 见 Bryk、 
Camburn 和 Louis (1999) , 
在 层 -1， 用 学 校 上 中 教师 /的 6 个 分 量 指标 (i =1,…,6) 来 预测 职业 社 
区 合成 指标 的 “ 真 值 分 ”: 
Yo=mten, ea ~ N(0,03,) [8.25] 


D WE: WM ARS PERA. 
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Hop: 
Y AEE BE k 中 的 教师 j 建立 职业 社区 指标 时 6 个 分 量 指标 之 一 的 测量 ; 
mx 是 这 一 教师 的 职业 社区 构件 指标 的 “ 真 值 ”; 
eu 是 与 教师 认 对 第 i 个 职业 社区 分 量 上 的 应 答 相连 的 测量 误差 。 


注意 ， 这 一 层 -1 模型 的 主要 功能 是 将 6 个 分 别 的 分 量 测量 汇总 为 一 个 总 的 合 
成 指标 Tao 

到 现在 为 止 ， 在 各 种 例子 中 ， 都 是 假定 层 - 1 的 测量 误差 ej 未 知 ， 且 为 正 
态 分 布 ， 有 平均 数 为 0 及 某 一 相同 的 方差 。 然 而 ， 对 每 一 拉 氏 量度 指标 Sa 
估计 的 标准 误 允 许 我 们 将 测量 误差 明确 地 写 人 模型 。 具 体 而 言 ， 我 们 先 通过 将 
方程 8. 25 两 侧 同 乘 每 一 分 量 的 标准 误 估计 的 倒数 a,, = 5; ， 这 样 便 根据 各 分 
蕙 的 不 可 靠 性 调整 了 各 分 量 的 测量 ， 得 到 : 


Yh = auma teh, -NI0,1) [8.26] 


Hp, Yh =apYa, enapan 注意 ， 当 我 们 调整 了 测量 误差 后 ， 现 在 r 被 
固定 为 上。 

在 层 -2 模型 中 ， 教 师 的 “ 真 值 ” 被 作为 一 系列 教师 层次 特征 X,, RR 
教师 个 人 在 “ 真 值 ” 上 的 变异 用 请 来 代表 ， 假 定 它 为 正 态 分 布 ， 有 平均 数 为 
0, HHA: 


» - 
Ta = Bu + D Bua (Ypa -X +m, "a ~ N(0,7,) [8.27] 


通过 将 教师 层次 的 自 变量 按 其 总 平均 数 对 中 ，pBu 便 成 为 学 校 上 的 预测 平均 
数 ， 这 一 水 平 相当 于 其 教师 自 变量 测量 在 “平均 水 平 ”的 教师 结构 时 得 到 的 
平均 数值 。 这 里 ，P =1，…， PP 个 自 变量 与 结果 之 间 的 关系 由 B,, 代 表 。 
在 层 -3 模型 中 ， 学 校 的 调整 平均 数 是 学 校 各 种 特征 的 函数 : 


o 
Bu = Yoo + È Wa + Ug, uy ~ N(O,7,) 
Bu = Tas | apt pr a [8.28] 
其 中 ，yw 是 调整 了 测量 误差 和 教师 结构 以 后 的 职业 社区 构件 的 总 平均 数 估计 。 


Ym 是 g=1,… ,0 个 系数 ， 表 示 学 校 特征 与 职业 社区 之 间 的 关系 。wuos 代 表 的 是 
属于 学 校 上 的 个 别 差异 。 
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估计 三 层 模型 中 的 随机 系数 


本 章 着 重 介绍 了 应 用 三 层 模型 来 估计 多 层 的 固定 效应 和 方差 协 方差 分 量 ， 
三 层 模型 还 能 提供 对 层 -2 和 层 - 3 的 随机 系数 的 经 验 贝 叶 斯 估计 。 我 们 先 沿 
用 了 前 面 介绍 过 的 关于 学 生成 绩 的 简单 模型 (参见 “完全 无 条 件 模 型 ")， 其 
中 有 学 生 嵌 套 于 班级 继而 嵌 套 于 学 校 的 关系 结构 。 在 这 个 无 条 件 的 三 层 模型 
中 ， 分 层 分 析 提 供 以 下 的 合成 估计 (经 验 贝 叶 斯 估计 )， 即 每 个 班级 的 平均 数 
( 层 -2) 和 每 个 学 校 的 平均 数 ( 层 -3): 


mos = Aafa + (1 - A) Bow [8.29] 

Bon = Au Boor + (1 - Àn) Foo [8.30] 
Hp, Ap As, 是 方程 8.7 和 8. 8 中 定义 的 班级 层次 平均 数 和 学 校 层次 平均 数 
的 可 向 性 ;Yow 是 总 平均 数 的 估计 ; poor 是 对 Bu, 的 加 权 最 小 一 乘 估计 : 


Yl +e my "Fy 
be = 一 二 一 一 一 一 [8.31] 


注意 ,Bi 将 经 典 加 权 最 小 二 乘 估计 Boi 按 与 1 - A, 成 比例 的 量 ， 即 Bo, 9 
不 可 靠 性 ， 向 总 平均 数 Yo 收缩 。 与 此 类 似 ，wri 也 将 样本 平均 数 卫 , 按 与 1 - 
is 成 比例 的 量 ， 即 对 学 校 大 计算 的 也 的 不 可 靠 性 ， 向 Bo 收缩 。 


I 
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。 引言 
© 两 层 分 层 线性 模型 的 关键 假定 
e 建立 层 -1 模型 

。 建立 层 -2 模型 

© 在 样本 为 小 样本 时 推断 的 有 效 性 
e 附录 
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一 个 好 的 数据 分 析 应 开始 于 对 可 能 在 随后 的 多 元 分 析 中 用 到 的 每 个 变量 进 
行 仔细 的 频数 分 布 检查 。 检 查 每 -变量 的 模式 和 水 平 可 以 审核 数据 质量 ， 识 别 
异常 观测 值 ， 还 可 以 考虑 是 否 需要 做 变量 的 转换 。 建 模 的 下 一 步 涉 及 双 变 量 关 
系 的 探测 。 两 个 连续 变量 的 标 绘图 有 助 于 识别 可 能 的 非 线性 关系 和 由 于 观测 错 
误 产生 的 特异 案例 。 在 拟 合 分 层 模型 之 前 ， 需 要 对 每 一 层次 做 这 种 分 析 。 

此 外 ， 还 需要 进行 各 层 之 间 的 探测 性 分 析 。 比 如 ， 在 进行 学 校 效应 研究 之 
前 ,检查 每 一 学 校 的 OLS 回归 是 很 有 帮助 的 ， 它 能 使 研究 人 员 找 出 特异 的 学 
校 ， 即 那些 回归 截 距 或 斜率 令 人 难以 置信 的 学 校 。 我 们 可 以 专门 研究 这 些 奇异 
结果 的 可 能 原因 ， 比 如 样本 规模 太 小 、 所 调研 的 学 校 的 确 具有 不 一 般 的 特征 ， 
甚至 可 能 发 生 了 编码 错误 。 由 于 样本 规模 太 小 产生 的 奇怪 结果 不 是 问题 ， 因 为 
第 3 章 详 细 介绍 的 估计 方法 在 这 一 方面 很 稳健 。 然 而 ， 由 于 数据 质量 不 好 产生 
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的 扭曲 问 归 却 是 很 严重 的 问题 ， 因 为 那些 特异 的 学 校 会 对 估计 产生 很 大 的 
影响 。 


考虑 模型 的 假定 条 件 


基于 标准 线性 模型 的 推断 的 有 效 性 依赖 于 这 一 模型 的 结构 部 分 和 随机 部 分 
的 假定 条 件 是 否 成 立 。 就 结构 部 分 而 育 ，OLS 估计 要 求 模 型 的 设置 要 适当 ， 其 
中 因 变 量 结 果 是 回归 系数 的 线性 函数 。 当 误差 项 中 的 某 些 部 分 与 模型 中 的 一 个 
或 多 个 自 变 量 相关 时 ， 就 发 生 了 模型 设置 的 错误 。 

在 分 层 线性 模型 中 ， 每 一 层次 的 模型 设置 都 涉及 假定 条 件 ， 并 且 某 一 层 的 
错误 设置 还 会 影响 到 其 他 层次 的 结果 。 此 外 ， 由 于 层 -2 各 方程 之 间 可 能 存在 
相关 误差 ， 一 个 方程 的 错误 设置 会 导致 其 他 方程 的 估计 产生 偏差 。 比 如 ， 在 第 
4 章 中 我 们 将 每 一 学 校 的 截 距 和 斜率 作为 层 - 2 模型 的 简单 回归 的 因 变 量 。 重 
要 的 是 ， 要 知道 对 这 一 模型 中 截 距 的 错误 设置 将 会 对 层 -2 斜率 模型 的 系数 估 
计 产 生 多 大 的 影响 。 

就 模型 的 随机 部 分 而 言 ，OLS 回归 假定 各 项 误差 独立 并 有 相同 方差 。 标 准 
的 假设 检验 还 要 求 ， 误 差 项 为 正 态 分 布 。 在 分 层 分 析 中 ， 层 - 1 和 层 -2 都 应 
用 了 误差 项 为 正 态 分 布 的 假定 。 虽然 对 这 些 假定 条 件 的 违反 并 不 导致 层 -2 系 
数 估计 产生 偏差 ， 但 是 会 造成 对 标准 误 估计 及 其 他 推断 统计 的 不 利 影响 。 与 此 
类 似 ， 层 -1 随机 系数 和 方差 协 方差 分 量 的 估计 也 会 产生 扭曲 。 

有 经 验 的 数据 分 析 人 员 非 常 重视 其 模型 所 要 求 的 假定 条 件 。 他 们 研究 所 用 
数据 是 否 满足 有 关 假 定 条 件 ， 并 考虑 其 结论 对 这 些 假定 条 件 的 敏感 性 。 当 发 现 
严重 违反 假定 时 ， 便 寻求 改进 方案 。 在 本 章 中 ， 我 们 主要 讨论 固定 效应 及 其 标 
准 误 和 有 关 推断 统计 的 估计 ， 因 为 这 些 是 大 多 数 研究 者 的 首要 兴趣 所 在 ， 并 且 
因为 这 些 统计 的 性 质 大 部 分 都 是 已 知 的 。 本 章 还 将 简单 勾画 有 关 随 机 系数 和 方 
差 协 方差 分 量 的 推断 统计 的 含义 。 


本 章 的 安排 


第 5 章 至 第 7 章 通过 一 系列 两 层 模型 的 应 用 示范 了 分 层 模型 的 逻辑 。 在 本 
章 中 ,我 们 关注 于 制定 这 些 模型 时 的 关键 决策 问题 、 所 依赖 的 假定 条 件 以 及 有 
助 于 模型 建立 的 经 验 步骤 。 虽 然 分 层 线性 模型 涉及 一 套 相 互联 系 的 设置 工作 ， 
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以 及 应 用 于 层 ~1 和 层 -2 的 许多 假定 ， 为 了 使 表述 更 为 清楚 ， 我们 先 讨论 层 -1 
模型 ， 然 后 再 讨论 层 -2 模型 。 这 样 的 讨论 实际 上 遵循 了 模型 建立 过 程 的 一 般 硕 
序 。 研 究 人 员 都 是 先 尝试 性 地 建立 层 - ! 模型 ， 然 后 再 考虑 层 -2 模型 ， 结 果 可 能 
还 会 再 反 过 来 修改 层 -1 模型 。 对 本 章 的 大 部 分 内 容 ， 我 们 都 假定 最 大 似 然 估计 的 
大 样本 理论 的 条 件 成 立 。 在 最 后 一 节 ， 我 们 将 讨论 在 层 ~1 和 层 -2 的 样本 规模 不 
够 大 的 情况 下 有 关 估 计 的 性 质 。 

本 章 所 用 的 示例 与 第 4 章 所 讨论 的 类 似 ， 它 是 对 高 中 数学 成 绩 的 研究 。 我 
们 先 考虑 一 个 层 - 1 模型 ; 

Y; = By +B, (SES), +r, [9.1] 

其 中 ， 力 是 学 校 /的 学 生 的 数学 成 绩 ， 它 依赖 于 学 生 的 社会 阶层 。 在 层 -2， 
有 : 


Ba = Yo + Yo (MEAN SES), + yo (SECTOR), + u, 
Bı, = Yo + yu (MEAN SES), + y,, (SECTOR), + u, [9.2] 


两 层 分 层 线性 模型 的 关键 假定 


方程 9.1 和 9.2 只 是 一 般 两 层 模型 的 具体 情况 。 层 - 1 的 一 般 模型 为 : 

Y; smt aan [9.3] 
在 层 -2， 对 每 一 Bu， 有 : 

By = yet DW, +m [9.4] 


从 形式 上 ， 我 们 假定 以 下 条 件 ; 

L 对 应 每 一 层 -2 单位 j 中 的 每 一 层 - 1 单位 i 的 r, 都 是 独立 的 ， 且 为 正 
态 分 布 ， 有 平均 数 为 0 和 方差 为 oa? [B r, ~id N(0, o°) ]。 

2. 层 -1 自 变量 XX 独立 于 r，[ 即 对 所 有 的 g， 有 Cov(X,, r) =0 ]。 

3. fe -2 的 0 +1 个 随机 误差 的 向 量 为 多 元 正 态 分布 ， 每 一 个 都 有 平均 数 
为 0 和 某 一 方差 rw ， 并 且 随 机 元 素 9 与 9' 之 间 的 协 方差 为 rw。 层 -2 的 J 个 
单位 的 随机 误差 向 量 之 间 相 互 独立 【 即 岂 = (ug, ug)’ ~ iid N(O, T)] 
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4. 一 套 层 -2 AER ( 即 贯穿 Q +1 的 方程 中 的 多 ,中 所 有 不 同 元 素 ) 都 独 
立 于 每 一 个 误差 项 w。[ 即 对 每 一 对 W, 和 us 都 有 Cov( W,, uy) =0]。 

5. 层 -1 的 误差 与 层 -2 的 误差 之 间 也 相互 独立 [ 即 对 所 有 的 g 都 有 
Cov (rj, uy) =0]。 

6. 每 一 层 上 的 自 变量 都 与 其 他 层 上 的 随机 效应 无 关 。 即 对 于 所 有 的 4 与 
ti Cov(X,,, uy) =O, FAA Cov(W,, ry) =0。 

假定 条 件 2、4、6 表示 的 是 模型 中 结构 部 分 纳 人 的 变量 (和 WW) 与 其 相 
连 的 误差 项 (Mu) 之 间 的 关系 ， 它 们 关系 到 模型 设置 的 恰当 性 。 它 们 的 
适用 性 影响 到 y, 估 计 的 偏差 [ 即 是 否 E(7,) =y。]。 假 定 条 件 1、3、5 只 关 
注 模型 的 随机 部 分 (7, 和 4,)， 它 们 的 适用 性 会 影响 到 selh) 估计 的 一 致 性 ， 
影响 到 BpB; 6* 和 全 的 准确 性 ， 以 及 假设 检验 和 辕 信 区 间 的 准确 性 。 

对 于 方程 9.1 和 9.2 这 样 的 简单 两 层 模型 ， 我 们 假定 以 下 条 件 ， 

1， 在 一 个 学 生 的 县 体 社会 阶层 的 前 提 下 ， 学 校 之 内 的 误差 为 正 态 分 布 并 相 
互 独立 ， 每 一 学 校 都 有 平均 数 为 0 和 所 有 学 校 有 相同 的 方差 《假定 1) 。 

2. 当 任何 影响 数学 成 绩 的 学 生 层 次 自 变量 从 模型 中 被 删除 时 ， 即 将 此 归 入 
误差 项 , 7, 仍 须 与 学 生 的 社会 阶层 相互 独立 (假定 2) 。 我 们 更 为 强调 的 是 ， 关 注 
所 删 自 变 量 是 否 为 真正 的 预测 变量 其 于 关注 相关 的 结果 变量 。 

3. 假定 学 校 的 残 差 效应 ww 和 u 之 间 为 二 元 正 态 分 布 ， 分 别 有 方 差 re 和 
Tu， 并 且 有 协 方差 7。。( 假 定 3)。 

4. 在 估计 截 距 和 SES 斜率 的 模型 中 所 删除 的 任何 学 校 层次 自 变量 的 效应 
都 须 与 MEAN SES 和 SECTOR 这 两 个 变量 独立 (假定 4)。 

5. 层 -1 的 误差 与 学 校 层次 的 残 差 效应 uo 和 u, 独 立 。 

6. 任何 要 删除 的 学 生 层 次 自 变量 的 效应 将 归 入 误差 项 r,， 这 个 自 变量 必 
须 与 层 -2 模型 的 自 变量 (BI MEAN SES 和 SECTOR) 独立 。 此 外 ， 任 何 要 删 
除 的 学 校 层 次 自 变量 的 效应 将 归 人 层 -2 随机 效应 uw,， 它 必须 与 学 生 层 次 自 变 
量 ( 即 SES) 无 关 。 

我 们 以 这 种 形式 来 描述 这 些 假 定 ， 是 为 了 系统 地 质询 其 有 效 性 。 假 定 1 和 2 
属于 层 -1 模型 内 部 的 ， 可 以 通过 检查 层 ~ ! 的 数据 和 残 差 来 进行 一 定 程度 的 探 
测 。 假 定 3 和 4 属于 层 -2 模型 内 部 的 ， 可 以 通过 探测 层 - 2 的 数据 和 残 差 来 做 
一 定 程度 的 检查 。 与 此 不 同 ， 假定 5 和 6 关系 到 层 间 关联 ， 还 需要 更 多 的 讨论 。 

击 在 我 们 来 介绍 在 建立 层 -1 和 层 -2 模型 的 过 程 中 对 这 些 假定 条 件 的 
E, 
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建立 层 -1 模型 


建立 模型 的 初期 涉及 理论 与 经 验 的 有 关 考 虑 。 所 研究 的 实际 理论 可 以 提出 
少数 可 能 的 自 变 量 来 建立 层 -1 模型 。 这 里 存在 两 个 问题 : (a) 是 否 应 该 将 候 
NX, 纳入 模型 ? 如 果 答 案 是 肯定 的 ， 还 需要 考虑 (b) 如 何 设置 该 系数 ? 
是 定义 为 随机 系数 ， 还 是 固定 系数 ， 或 是 非 随机 变化 的 系数 ? 

把 层 -2 自 变量 的 问题 先 放 在 一 边 ， 分 析 关注 于 不 同 分 层 模型 之 间 的 比 
B, 每 一 种 在 层 -2 都 是 无 条 件 模型 。 人 们 自然 会 希望 先 估计 一 个 “ 侈 和 ”的 
层 -1 模型 ， 即 包括 所 有 可 能 的 自 变 量 且 都 有 随机 斜率 的 模型 ， 然 后 再 从 模型 
中 逐步 淘汰 那些 不 显著 的 效应 。 遗 震 的 是 ， 除 非 层 - 1 样本 规模 非常 大 ( 即 足 
以 支持 得 到 各 个 单位 的 层 -1 各 系数 的 稳定 估计 )， 耕 则 这 种 分 析 策 略 一 般 没 
有 用 。 即 使 真是 这 样 ， 这 样 一 个 饱和 模型 也 可 能 需要 几 百 次 的 迭代 才能 收敛 ， 
并 且 通 常 产生 一 大 堆 不 显著 的 结果 ， 对 后 续 研 究 没 有 什么 指导 作用 。 我 们 知 
道 ， 只 有 一 个 固定 量 的 变异 能 被 解释 。 如 果 设 置 了 过 多 的 随机 层 -1 系数 ， 便 
过 度 拟 合 了 这 一 模型 ， 使 这 些 差异 被 划分 为 许多 小 块 ， 但 哪 一 块 都 不 显著 。 这 
里 的 问题 就 像 调整 投影 仪 的 焦距 。 如 果 素 焦 超 出 了 适当 的 范围 ， 那 么 影像 便 丧 
失 了 焦点 。 

总 之 ， 我 们 发 现 ， 采 用 “ 步 进 ”策略 往往 效果 更 好 。 假 如 某 种 外 部 理论 
已 经 定义 了 少数 的 自 变量 时 ， 我 们 可 以 根据 情况 从 单 自 变量 模型 逐步 扩展 到 双 
自 变 量 、 三 个 自 变量 (FS) 的 模型 。 通常， 可 以 通过 对 层 - 1 的 OLS 分 析 来 
识别 出 最 好 的 层 -1 自 变量 子 集 。 


指导 建立 层 -1 模型 的 经 验方 法 


对 于 分 层 分 析 ， 需 要 解决 两 个 问题 : (a) Xw 的 固定 效应 是 否 显著 ? (b) 是 
否 有 证 据 表明 斜率 存在 异 质 性 [EP Var (B,) >0]? 斜率 存在 异 质 性 的 统计 证 
据 包括 7w 的 点 估计 和 相应 的 同 质 性 检验 指标 ( 即 第 3 章 所 介绍 的 X 和 似 然 比 
检验 ) 。 此 外 ， 在 这 一 方面 ， 有 用 的 指标 还 包括 对 OLS 截 距 和 斜率 所 估计 的 可 


靠 性 。 
当 可 人 靠 性 变 得 很 小 时 (如 <0.05)，, 我 们 所 要 估计 的 方差 便 可 能 接近 于 0 
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(技术 上 称 为 接近 参数 空间 的 边界 )。 这 种 情况 因 方差 协 方差 分 量 估计 中 所 应 
用 的 具体 迭代 计算 程序 而 导致 许多 不 同 的 计算 困难 。 尽 管 一 些 算法 将 非 正常 地 
结束 (或 需要 修改 才能 继续 ) ， 但 EM 算法 仅仅 是 使 计算 速度 减 慢 而 已 。 在 极端 
的 场合 ， 它 需要 极 长 时 间 才 能 达到 收 剑 .检查 算出 结果 的 可 靠 性 可 以 了 解 所 设置 
的 层 -1 的 随机 系数 能 否 改定 为 固定 系数 或 非 随机 变化 的 系数 。 重 新 设置 的 模型 
也 许 会 很 快 地 达到 收敛。 

有 趣 的 是 ，EM 算法 的 收敛 速度 是 由 选 代 次 数 所 标志 的 ， 它 本 身 具 有 可 诊 
断 性 。 如 果 数 据 能 提供 很 多 信息 ，EM 算法 将 迅速 达到 收敛 (比如 仅 迭 代 10 
次 以 内 )。 与 此 相反 ， 如 果 模 型 有 很 多 个 随机 效应 且 数 据 信息 相对 贫乏 ， 就 需 
BBR LAK. 

检查 层 -1 系数 之 间 的 相关 也 是 一 种 诊断 方法 (参见 第 6 章 中 的 词汇 量 增 
长 分 析 )。 如 果 发 现存 在 共 线性 或 多 元 共 线 性 ， 那 么 这 一 模型 必须 简化 。 一 种 
方案 是 约束 一 个 或 多 个 随机 效应 为 0， 于 是 便 能 消除 共 线性 。 当 随机 效应 被 定 
为 0 而 变化 很 小 或 根本 没 变化 时 ， 说 明 这 种 方法 很 奏效 。 如 果 不 能 忽视 每 一 随 
机 效应 的 变化 时 ， 最 好 对 这 些 随机 效应 强加 线性 约束 。 比 如 ， 两 个 随机 效应 可 
以 被 约束 为 相关 系数 为 1.0 或 -1.0, 但 可 以 有 非 0 的 方差 。 这 种 方案 可 以 视 
为 对 层 -2 随机 效应 施加 了 一 个 因素 模型 的 特例 (Miyazaki, 2000) 。 

总 之 ， 分 析 人 员 在 设置 层 - 1 系数 为 随机 系数 时 必须 谨慎 。 在 两 层 模型 中 
(其 中 层 -1 具有 相同 方差 和 独立 的 误差 ) ， 要 估计 的 方差 协 方差 分 量 的 数目 为 
m(m+1)/2+1, Hip m 是 模型 中 层 -1 的 随机 自 变量 个 数 。 很 清楚 ， 这 一 数 
目 随 m 变化 而 迅速 增加 。 当 随机 效应 的 个 数 增加 时 ， 便 需要 大 得 多 的 信息 量 
才能 得 到 方差 协 方 益 分 量 的 合理 估计 。 比 如 ， 高 中 及 以 上 学 校 研 究 的 数据 中 包 
含 160 个 学 校 ， 每 个 学 校 约 有 45 个 学 生 ， 我 们 发 现 该 数据 最 多 支持 模型 中 同 
时 容纳 三 个 随机 系数 加 上 一 个 随机 截 距 ( 当 对 每 个 学 校 有 更 多 的 观测 时 ， 或 
当 层 -1 模型 拟 合 得 非常 好 即 o’ 很 小 时 ， 这 一 数目 便 能 增加 ) 。 模 型 到 底 能 设 
置 多 少 个 随机 效应 是 无 法 确定 的 ， 因 为 这 一 最 大 值 有 赖 于 好 几 个 因素 ; 方差 分 
量 的 幅度 、 随 机 效应 之 间 相 互 关 联 的 程度 、o 的 幅度 以 及 其 他 方面 的 数据 
特征 。 

然而 ， 还 有 一 点 需要 注意 : 尽管 推断 性 的 和 描述 性 的 统计 可 能 表示 一 些 
To 为 0 或 接近 于 0， 但 这 并 不 能 预先 排除 将 相应 B。 作 为 非 随机 变化 设置 的 可 能 
性 。 如 果 理 论 上 可 以 论证 这 些 效应 存在 ,分析 人 员 应 该 继续 尝试 在 层 -2 模型 
中 这 样 设置 8B,。 比 如 ， 这 种 情况 在 Lee 和 Bryk (1989) 对 少数 种 族 学 生 差别 
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的 研究 中 便 发 生 过 ， 我 们 曾 在 第 5 章 对 此 做 过 讨论 。 前 期 研究 表明 存在 学 校 的 
类 别 差异 ， 但 是 这 种 差异 完全 可 以 解释 为 是 学 校 因素 的 卫 数 。 这 种 情况 再 一 次 
表明 ， 统 计 证 据 与 虚无 假设 一 致 并 不 意味 着 它 就 是 真 的 。 

最 后 还 有 一 个 问题 ， 某 一 具体 的 层 - ! 自 变 最 是 否 真 的 属于 这 个 模型 ? 要 
删除 一 个 变量 需要 具备 两 个 条 件 : 第 一 ， 如 上 所 述 ， 没 有 斜率 异 质 性 的 证 据 ; 
第 二 ， 没 有 “平均 水 平 ”或 固定 效应 的 证 据 。 在 后 一 种 情况 下 ， 相 应 的 yw 的 
幅度 应 该 很 小 且 + 比率 应 该 不 显著 。 

为 了 审核 层 -1 自 变 重 是 否 在 平均 水 平 上 存在 非 0 的 固定 效应 ， 可 以 直接 
将 这 一 自 变量 纳 和 模型， 检验 其 系数 的 显著 性 。 这 种 方法 假定 这 $ 个 自 变量 和 
结果 之 间 的 关系 是 线性 的 。 这 一 线性 假定 可 以 用 做 图 方法 检查 ， 即 按 层 - 1 经 
验 贝 叶 斯 残 差 〈 见 方程 3. 63) 和 这 一 自 变 量 画 出 标 绘图 。 拟 合 一 个 非 参 数 的 
非 线性 曲线 (比如 一 条 “lowess” 曲 线 ) 一 般 便 可 以 揭示 这 种 关系 的 非 线 性 。 
这 种 非 参数 曲线 现在 已 经 成 为 标准 统计 软件 的 常规 计算 程序 。 


Fe -1 的 模型 设置 问题 


模型 的 设置 假定 意味 着 ， 当 层 -1 自 变 量 既 相关 于 了 ,又 相关 于 模型 中 的 其 
他 立时 ， 就 不 能 从 模型 中 省 略 这 个 自 变量 。 要 是 这 个 自 变量 被 省 略 ， 一 个 或 多 
个 B 的 估计 将 有 偏 。 结 果 是 ， 层 -2 对 这 个 B 的 模型 也 是 有 偏 的 。 然 而 ， 正 如 
我 们 后 面 将 要 讨论 的 那样 ， 存 在 一 些 条 件 使 这 种 偏差 不 会 发 生 。 

我 们 注意 到 ， 即 使 一 个 变量 就 平均 水 平 对 单位 内 部 没有 影响 时 ， 要 是 省 略 
它 ， 也 会 违反 假定 条 件 。 也 就 是 说 ， 它 的 圈定 效应 可 能 不 存在 ， 但 是 如 果 这 一 
自 变量 的 效应 在 各 组 之 间 有 所 变化 ， 以 及 它 与 其 他 层 - 1 的 随机 系数 有 关 时 ， 
要 是 层 - 1 模型 中 不 包括 它 便 还 是 错误 的 设置 。 比 如 ， 在 Raudenbush, Kid- 
chanapanish 和 Kang (1991) 对 泰国 小 学 的 研究 中 ， 就 泰国 所 有 的 小 学 而 言 ， 
学 生 的 性 别 对 数学 成 绩 没 有 固定 影响 。 但 是 ， 实 际 上 ， 在 不 同 的 学 校 中 ， 这 一 
效应 在 幅度 和 方向 上 都 有 所 不 同 。 在 某 些 学 校 中 ， 男 孩 的 成 绩 显著 地 比 女 孩 
高 ， 而 在 另 一 些 学 校 中 ， 则 是 女孩 成 绩 更 高 。 


层 -1 错误 设置 对 层 -2 估计 的 影响 
截 距 模型 。 众 所 周知 ， 朴 忽 设 置 层 - 1 协 变量 会 导致 在 层 -2 对 截 距 的 自 
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变量 的 估计 产生 严重 偏差。 比如 ， 在 高 中 及 以 上 学 校 数据 中 有 一 个 学 生 以 往 的 
学 业 背 景 (ACADEMIC BACKGROUND) 的 测量 ， 直 到 现在 在 分 析 中 还 一 直 被 
忽略 。 如 果 学 业 背 景 与 数学 成 绩 有 关 ， 并 且 如 果 天 主教 学 校 和 公立 学 校 的 学 生 
在 学 业 背 景 上 有 显著 差别 ， 那 么 我 们 以 前 所 估计 的 学 校 类 别 (SECTOR) 对 Bu 
的 效应 便 是 有 偏 的 。 

这 一 偏差 可 以 通过 一 两 种 方法 来 消除 ， 这 取决 于 对 学 业 背 景 这 个 变量 所 
应 用 的 对 中 方法 。 如 果 学 业 背 景 是 在 层 - 1 被 纳入 的 ， 并 且 它 是 以 其 总 平均 
数 对 中 的 ， 假 如 学 业 背 景 的 测量 没有 误差 ， 并 且 它 与 结果 之 间 是 线性 关系 ， 
那么 每 一 单位 的 截 距 Bu 便 是 按 不 同学 校 在 这 一 变量 上 的 平均 差异 进行 调整 
的 ， 那 么 这 一 来 源 的 偏差 便 被 消除 了 - 另 一 种 可 能 是 ， 学 业 背 景 也 是 在 层 -1 被 纳 
入 模型 的 ， 但 是 以 组 平均 数 对 中 。 在 这 种 情况 下 ， 可 以 通过 将 学 业 背 景 的 学 
校 平均 数 作为 层 -2 截 距 寞 型 的 自 变量 来 消除 这 一 偏差 。 要 是 学 业 背 景 存在 
着 构成 效应 ( 见 第 5 章 ) ， 或 者 学 业 背 景 的 斜率 被 作为 随机 的 ， 那 么 后 一 种 
解决 方案 更 好 。 

斜率 模型 。 层 - 1 模型 的 错误 设置 对 层 - 2 斜率 模型 的 影响 要 比 对 截 距 模 
型 的 影响 更 为 复杂 。 就 一 个 具体 的 例子 来 分 析 时 ， 这 些 影响 便 更 容易 理解 
(对 公式 的 推导 请 参见 本 章 的 附录 )。 设 想 在 方程 9. 1 这 样 一 个 层 - 1 模型 中 ， 
本 来 应 该 纳入 一 个 混杂 变量 一 一 学 业 背 景 ， 要 说 明 其 对 斜率 模型 中 系数 估计 y 
的 影响 ， 我 们 将 学 业 背 景 作为 层 ~ 1 自 变量 纳入 模型 ， 重 新 分 析 了 数据 。 表 
9.1 提供 了 有 关 结 果 。 就 形式 而 言 ， 学 业 背 景 在 层 -1 产生 了 混杂 作用 ， 它 既 
预测 了 结果 ， 又 与 学 生 的 社会 经 济 状况 (SES) 相关 。 

为 了 将 我 们 的 注意 力 集中 于 社会 经 济 状况 的 斜率 模型 ， 我 们 将 学 业 背 景 按 
其 学 校 平均 数 对 中 。 如 表 9. 1 所 示 ， 在 原 有 条 件 下 加 入 变量 一 一 学 业 背景 对 模 
型 的 截 距 并 无 影响 (注意 ， 在 有 没有 学 业 背景 这 个 变量 时 ，7o 和 7 其 实 没 什 
么 差别 ) 。 

另 一 方面 ， 斜 率 模型 的 效应 估计 却 变 化 很 大 。7y 的 估计 受 省 略 学 业 背 景 
影响 是 合乎 思 辑 的 ， 因 为 学 业 背 景 和 社会 经 济 状况 都 与 成 绩 正 相 关 ， 同 时 它们 
之 间 又 存在 正 相关 ， 那 么 学 校内 的 平均 社会 经 济 状况 的 斜率 在 控制 了 学 业 背 景 
的 条 件 下 就 应 该 变 得 较 小 。 表 9. 1 的 结果 肯定 了 这 样 一 个 推论 ， 当 学 业 背 景 被 
纳 人 模型 后 ，y,。 的 估计 值 从 1.78 缩小 为 1.13。 
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表 9.1 学 业 背 景 (ACADEMIC BACKGROUND) 的 混杂 作用 * 
原 模型 估计 加 入 学 业 背 景 为 周 定 效应 











国定 效应 系数 se 系数 se 

模型 : FR EMH, Bo, 

MH. Yoo 13.7 0.20 13.74 0. 20 

MEAN SES, ym 4.54 0.48 4.55 0.48 

SECTOR, Yo 0.83 0.20 0.83 0. 20 
模型 : OER SES 斜率 ,有 

BE, yo 1.78 0. 16 1.13 0.16 

MEAN SES, yu 0, 68 0.38 0.29 0. 36 

SECTOR, yn -0.58 0. 16 -0.39 0.15 
模型 : 学 校 ACADEMIC BACK GROUND $PE, By 

HP. Yx 2. 14 0.09 





注 ; a 本 章 所 用 数据 类 似 于 第 4 章 和 第 5 章 中 所 用 数据 ,但 并 不 是 同一 数据 。 由 于 在 新 的 层 -1 自 变 
最 学 业 背 景 中 有 数据 缺失 。 所 以 这 里 的 分 析 样本 略 有 不 同 ; HA MEAN SES 是 对 社会 阶层 的 学 校 级 测 最 ， 
但 不 是 层 -1 中 学 牛 个 人 信息 的 简单 平均 数 。 最 后 ， 学 校 类 别 SECTOR 采用 的 编码 是 : 公立 学 校 为 -1， 天 
主教 学 校 为 1， 这些 差别 对 本 章 的 示范 没有 影响 ， 但 是 ， 这 里 的 结果 的 确 与 以 前 各 章 没有 严格 的 可 比 性 。 


在 估计 yn 和 yi 时 偏差 来 源 更 为 复杂 。 因 为 涉及 层 -2 变量 (学 校 的 社会 
经 济 状况 均值 MEAN SES 和 学 校 类 别 SECTOR) 与 层 -1 变量 (学 生 的 社会 经 
济 状况 SES) 之 间 的 互动 ， 这 两 个 系数 被 称 为 层 间 交互 效应 ( cross-level inte- 
raction effects) 。 省 略 一 个 层 -1 自 变量 而 干扰 层 间 互 动 的 推断 ， 有 三 个 必要 条 
件 (对 此 的 证 明 在 本 章 附录 中 ): 

1. 在 控制 了 其 他 模型 白 变量 的 条 件 下 ， 这 一 省 略 变量 必须 与 了 相关 。 

2. 这 一 省 略 变量 必须 与 已 经 被 纳 人 模型 的 某 个 大 相关 。 

3. 这 一 省 略 变量 与 某 个 于 的 关联 本 身 必 须 在 不 同 单位 之 间 有 变化 ; 并 且 
两 者 之 间 的 关联 强度 必须 与 某 个 层 -2 自 变量 相关 。 

表 9. 1 的 结果 清楚 地 表明 ， 省 略 了 学 业 背 景 这 个 变量 造成 了 yu 和 yi 的 估 
计 偏 差 。 当 学 业 背 景 被 加 入 模型 后 ， 这 两 个 效应 估计 值 都 显著 缩小 了 : 学 校 的 
社会 经 济 状况 均值 (MEAN SES) 对 学 生 的 社会 经 济 状况 (SES) 斜率 的 效应 
从 0.68 缩小 为 0.29; 而 学 校 类 别 (SECTOR) 的 效应 幅度 从 - 0.58 升 为 
-0.39。 

上 述 三 个 条 件 中 的 每 一 个 都 适用 于 这 个 例子 。 条 件 1 可 以 通过 将 数学 成 绩 
对 学 生 的 社会 经 济 状况 和 学 业 背 景 做 一 个 简单 的 回归 分 析 来 检查 。 学 业 背景 在 
控制 了 学 生 的 社会 经 济 状况 的 条 件 下 也 与 数学 成 绩 相 关 ， 这 不 足 为 奇 。 条 件 2 
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和 3 可 以 通过 一 个 随机 系数 模型 来 研究 ， 即 将 学 业 背 景 对 学 生 的 社会 经 济 状况 
(SES) 做 回归 ( 见 表 9.2)。 很 清楚 ， 这 两 个 变 基 之 间 的 平均 斜率 yo 高 度 显 
K., 4#it=11.56 (条 件 2)， 此 外 ,结果 还 表明 ， 这 种 关系 存 学 校 之 间 存 在 变 
化 [Var(B,) =0.016, p=0.017], 并 且 这 些 斜 率 与 模型 中 的 其 他 学 校 变 - 
fit ——MEAN SES 和 SECTOR 显著 相关 (条件 3; 参见 表 9. 2 最 后 一 部 分 的 加 
入 变量 后 解释 增 量 的 检验 统计 1-to-enter) 。 


R92 SHR (ACADEMIC BACKGROUND) 对 社会 
经 济 状况 (SES) 随机 系数 回归 





模型 
Y; =By, +B, (SES), +r, 
其 中 ，Y, = SAR EE i LER 

















Bo; = Yoo + Ma; 

By, = Yo + “ij 
GEE a 系数 se tt% 
FERE, yo 0.052 0.027 1.939 
MEAN SES #8, Yo 0. 262 0.023 11. 560 
随机 效应 LEE i df 好 Pp 值 
RUE, uo 0.081 159 597.5 0. 000 
SESAR, uy 0.016 159 198.9 0.017 

By, 对 MEAN SES 和 SECTOR Hit E’ 
系数 se 近 俱 t-to-enter 

MEAN SES -0.038 0.014 -2,750 
SECTOR -0. 030 0. 005 -5.591 





注 : a 在 机 章 所 描述 的 经 验 贝 叶 斯 残 差 的 基础 上 做 出 。 


层 -2 错误 设置 对 层 -1 估计 的 影响 

如 果 一 个 省 略 的 层 - 2 自 变量 与 层 -1 自 变量 相关 ， 那么 层 -1 自 变量 的 
系数 估计 也 会 有 偏 。 在 这 种 情况 下 ,我 们 有 Cov(u,, Xy) 40. 但 是 ， 这 一 
问题 不 需要 修订 层 -2 模型 也 可 以 解决 。 层 -1 自 变量 Y M - 2 随机 效应 之 
间 的 任何 协 方差 项 必须 通过 组 平均 ,和 那 一 随机 效应 之 间 的 协 方差 发 生 作用 ， 


9 ”评价 分 层 模型 的 恰当 性 249 


而 这 一 协 方差 能 够 通过 将 层 - 1 自 变量 对 组 平均 数 对 中 来 加 以 消除 .m 还 有 另 
一 种 方案 ， 在 每 一 层 -2 方程 中 加 入 苑 ,作为 协 变量 ， 也 能 消除 X ME -2% 
略 变量 之 间 的 任何 混杂 

这 两 种 方法 提供 了 对 层 - 2 省 略 自 变量 的 设置 对 层 - 1 固定 系数 估计 影响 
的 检验 。 因 此 ， 可 以 分 别 运 行 按 组 平均 数 对 中 和 不 按 组 平均 数 对 中 的 系数 模 
型 。 如 果 运 行 结果 表明 ， 与 层 - 1 自 变量 相关 的 层 - 1 固定 系数 基本 不 变化 ， 
就 说 明 这 -模型 不 太 受 此 类 偏差 的 干扰 。 


层 -1 自 变量 的 测量 误差 

如 果 SES 有 测量 误差 ，B, 的 估计 将 会 有 偏 ， 并 且 平 均 斜 率 ye 也 会 有 偏 。 
对 于 层 间 互 动 y,, 和 Yy,;， 本 章 附录 表明 ， 偏 差 仅 在 以 下 情况 中 产生 : (a) SES 
测量 的 可 靠 性 在 学 校 之 间 有 变化 时 ; (b) 可 靠 性 上 的 差异 与 模型 中 的 一 个 或 
多 个 层 -2 自 变量 有 关 时 。 


XS -1 随机 效应 的 假定 条 件 的 检查 


方差 的 同 质 性 

大 多 数 分 层 研 究 中 都 假定 层 -1 模型 的 误差 有 相同 的 方差 o*。 由 于 在 每 一 
单位 中 的 数据 量 有 限 ， 研 究 者 一 般 希 望 从 这 一 同 质 性 假设 开始 着 手 分 析 (一 
些 对 层 -1 方差 的 其 他 设置 曾 在 第 5 章 和 第 6 章 讨论 过 )。 如 果 层 -1 方差 在 
层 -2 单位 之 间 随 机 变化 而 这 些 方差 却 被 假定 为 相等 ， 那 么 对 推断 层 - 2 系数 
的 影响 将 不 会 很 大 。 偏 差 不 会 产生 ， 甚 至 连 标准 误 也 是 相当 稳健 的 (Kasim & 
Raudenbush，1998 ) 。 但 是 ， 如 果 这 些 方差 是 层 -1 或 层 -2 自 变量 的 系统 函 
数 ， 那么 后 果 将 更 为 严重 。 

一 旦 设置 了 一 个 尝试 性 模型 ， 研 究 者 可 以 检验 层 -1 方差 的 同 质 性 。 异 质 
性 可 能 有 几 个 不 同 的 原因 。 

1. 这 一 模型 可 能 有 一 个 或 多 个 重要 的 层 -1 自 变量 被 忽略 了 。 如 果 这 样 
的 变量 在 不 同 组 之 间 有 不 同 的 方差 ,那么 忽略 它 便 造成 层 - 1 方差 的 异 
质 性 。 


T 经 济 学 家 称 这 种 方法 为 “图 定 效应 ”分 析 ， 因 为 以 组 平均 数 对 中 与 包括 -1 个 虚拟 变量 作为 
自 变量 有 同样 的 效果 ， 于 是 便 在 层 -1 分 析 中 消除 了 所 有 层 -2 单位 的 轩 定 效应 。 
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2. 一 个 层 -1 自 变量 本 来 具有 随机 效应 或 非 随 机 变化 效应 ， 但 是 却 被 错误 
地 设置 为 固定 效应 ， 或 者 完全 在 这 个 模型 中 被 忽略 了。 

3. 某 一 个 或 多 个 单位 的 数据 质量 很 差 。 比 如 ， 一 个 简单 的 编码 错误 就 能 
造成 一 个 或 多 个 组 的 方差 膨胀 ， 并 在 整体 上 产生 显著 的 异 质 性 。 

4. 数据 为 非 正 态 分 布 ， 并 有 着 厚 尾巴 ( 即 比 正常 期 望 的 有 更 多 极端 的 观 
测 案例 ) ， 会 导致 方差 异 质 性 的 统计 检验 显著 。 参 数 检验 对 这 种 非 正 态 性 很 敏 
E, HAGE (FRE) 会 伪装 为 方差 异 质 性 。 

因为 这 些 原因 在 其 意义 上 相当 不 同 ， 我 们 建议 在 断定 需要 更 复杂 的 方差 假 
定之 前 ， 先 对 异 质 性 的 可 能 来 源 进行 研究 。 为 了 这 一 目的 ， 第 7 章 介绍 的 计算 
每 一 个 组 离散 情况 的 标准 化 测量 指标 很 有 用 : 


ls) - | Ess Ds] 
— 


— 9.5] 
1 CA)’ [9.5] 





一 个 简单 而 常用 的 对 同 质 性 的 检验 指标 是 : 


H= 》 [9.6] 


它 在 同 质 性 假设 条 件 下 具有 大 样本 好 分 布 ， 自 由 度 为 / - 1。 当 数据 是 正 态 的 
且 每 一 单位 的 样本 规模 在 10 以 上 时 ， 这 种 检验 是 适当 的 (Bartlett & Kendall, 
1946; 还 可 参见 Raudenbush & Bryk, 1987), 

似 然 比 检验 也 可 以 用 来 评价 层 -上 的 异 质 性 。 用 具有 同 质 性 方差 的 模型 作 
为 限制 模型 ， 用 以 比较 更 一 般 的 替代 模型 ( 比如 ，J 个 层 - 2 单位 中 的 每 一 个 
有 着 不 同 的 层 -1 方差 w ) 。 可 以 应 用 第 3 章 所 介绍 的 标准 程序 来 比较 这 些 将 
代 模 型 的 偏差 统计 时 。 

为 了 示范 ， 我 们 先 拟 合 方程 9.1 和 9.2， 然 后 检验 关于 方差 同 质 性 的 假 
定 。H 统计 值 为 312. 13， 自 由 度 为 159， 在 0.001 水 平 显著 。 这 一 结果 表明 ， 
在 160 个 学 校 之 间 存 在 层 -1 方差 的 异 质 性 。 这 就 要 求 在 下 一 步 分 析 之 前 先 要 
仔细 检查 层 - 1 模型 。 

一 种 可 能 的 情况 是 ， 观 测 异 质 性 主要 是 少数 几 个 特殊 的 学 校 造 成 的 。 实 际 
上 ， 标 准 化 离散 测量 的 概率 标 绘 图 表明 ， 很 大 数量 的 学 校 的 残 差 离散 度 要 比 所 
期 望 的 小 (参见 图 9.1) 。 这 些 案例 在 d 的 枝叶 图 上 很 容易 看 出 (参见 图 
9.2)。 然 后 ， 我 们 审阅 图 9. 2 中 识别 的 5 个 最 极端 的 情况 。 记 录 的 信息 看 起 来 
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是 准确 的 ， 问 题 显然 在 于 这 些 学 校 录取 的 学 生 有 同 质 性 方面 的 异常 。 这 种 结果 
建议 我 们 需要 考虑 在 方程 9. 1 中 加 入 新 的 变量 以 尝试 排除 这 种 残 差异 质 性 ， 至 
少 能 排除 其 中 的 一 部 分 。 


期 望 值 正 态 概 率 标 绘图 ，J=160 











0 
-1 
= n 
-2 2 
. 
-3 
4 — 上 — 
-6 -4 -2 0 2 4 
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图 9.1 160 所 高 中 学 校 的 残 差 离散 度 的 概率 标 绘图 
TE: a 标准 化 残 差 离散 度 按 方程 9.5 计算 。 
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BE 9. 2 160 所 高 中 学 校 的 残 执 离散 度 的 枝叶 图 
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总 而 言 之 ， 违 反 同 质 性 假定 本 身 并 不 是 估计 层 -2 系数 及 其 标准 误 中 的 严 
重 问题 ， 我 们 关注 它 主要 是 因为 这 种 异 质 性 也 许 表明 层 -1 模型 可 能 设置 有 
误 。 具 体 来 说 ， 层 -1 中 斜率 异 质 性 如 果 未 被 识别 ， 便 会 表现 为 层 -1 误差 
方差 的 异 质 性 。 如 前 所 述 ， 这 样 一 种 斜率 异 质 性 会 导致 层 -2 系数 的 估计 
Fi Md, 

UL BS AR ABE LPT as A aE eR EAS PE SE JS PR i ESET HE 
够 提供 信息 ， 但 对 观测 数据 中 违反 了 正 态 假定 却 是 相当 敏感 的 。 我 们 还 注意 
到 ， 一 些 个 别 的 必 极 端 值 构成 了 异 质 性 统计 量 #H 幅度 的 主要 部 分 。 所 以 ， 
与 以 前 一 样 ， 对 此 进行 检查 能 表明 哪些 类 型 的 单位 具有 特别 的 方差 。 也 许 还 
需要 对 某 些 单位 内 部 的 数据 质量 做 进一步 检查 。 在 其 他 情况 下 ， 对 了 进行 转 
换 可 以 减少 厚 尾巴 数据 效应 。 还 有 一 些 时 候 ， 我们 可 以 识别 d 与 某 一 单位 
特征 之 间 的 关系 模式 ， 比 如 学 校 类 别 。 可 以 考虑 将 这 些 变 量 纳 人 层 - 2 模型 
作为 自 变 量 ， 以 估计 层 -1 的 随机 斜率 系数 (进一步 的 讨论 请 参见 Rauden- 
bush & Bryk, 1987), 

当 怀疑 层 -1 方差 依赖 于 测量 的 自 变量 时 ， 一 种 方案 是 拟 合 这 些 自 变量 的 
对 数 线性 模型 (参见 第 5 章 中 “ 层 -1 方差 异 质 性 情况 下 的 应 用 ” ) 。 在 某 些 情 
BLP, REHE -1 方差 标志 着 需要 将 某 些 层 -1 系数 设 为 在 层 -2 是 随机 变 
化 的 ， 


正 态 性 假定 

第 10 章 将 讨论 几 种 不 同类 型 结果 变量 的 分 层 模型 应 用 ， 在 这 些 模型 中 ， 
E ~1 的 正 态 性 显然 是 不 切实 际 的 。 它 们 包括 二 类 结果 变量 、 计 数 数据 、 序 次 
结果 以 及 多 分 类 结果 。 在 这 些 情况 下 ， 概 率 模型 显然 比 正 态 模型 更 好 。 此 外 ， 
应 用 非 线性 的 连接 函数 也 是 明智 的 ， 并 且 可 以 推导 出 各 层 系数 的 自然 的 、 可 解 
释 的 效应 规模 。 

但 是 ， 如 果 结果 变量 是 连续 的 ,那么 层 - 1 采用 线性 模型 看 起 来 便 很 自 
然 ， 但 是 ， 也 许 会 违反 正 态 性 假定 。 在 这 种 情况 下 ， 层 -1 误差 的 非 正 态 性 不 
会 造成 层 -2 效应 的 估计 有 偏 ， 但 是 它 将 对 两 层 的 标准 误 造 成 偏差 ， 因 而 置信 
区 间 和 假设 检验 的 计算 也 会 有 偏差 。 人 们 对 这 些 效应 的 方向 及 其 严重 性 至 今 还 
知之 基 少 。 

如 果 单 位 的 数量 了 很 大 ， 数 据 的 正 态 性 能 够 通过 分 别 计算 各 个 单位 的 概率 
标 绘图 来 检查 ， 或 者 通过 审阅 各 单位 汇合 的 残 差 的 正 态 概率 标 绘图 来 检查 
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(然而 . 当 存在 方差 异 质 性 时 ， 这 些 汇合 的 标 绘图 将 会 产生 误导 )。 对 结果 变量 
或 若 十 自 变量 的 转换 也 可 能 对 误差 分 布 的 正 态 性 有 所 改善 。 


建立 层 -2 模型 


我 们 就 建立 层 - 1 模型 所 说 的 许多 做 法 也 适用 于 层 - 2。 在 理想 情况 下 ， 
这 一 工作 应 该 由 理论 来 驱动 ， 并 提出 对 层 -2 的 0 + 1 个 方程 的 期 望 关系 假设 。 
同样 ， 加 入 所 有 可 能 的 层 -2 自 变量 然后 逐步 淘汰 那些 不 显著 者 的 方法 一 般 都 
行 不 通 ， 因 为 存在 层 -2 单位 数量 的 限制 和 多 元 共 线性 问题 。 

在 回归 分 析 中 的 一 个 经 验 规则 是 ， 一 个 自 变量 至 少 要 有 10 个 观测 案例 
与 之 相对 应 。 对 于 分 层 模型 而 言 ， 类 似 的 规则 要 更 复杂 一 点 。 仅 预测 一 个 
层 -2 结果 ， 比 如 Bu， 观测 数 便 是 层 -2 的 单位 数 J， 并 且 常 规 的 10 例 规则 
可 以 依 此 类 推 。 

但 是 当 层 -2 GRAS + Bit, RAE -2 方程 中 包含 的 自 变 量 总 数 并 
不 确定 。 如 果 这 些 B 之 间 相 互 独立 ， 那 么 10 例 规则 可 以 分 别 适用 于 +1 个 
方程 中 的 每 一 个 。 但 是 ， 我 们 怀疑 ， 这 一 规则 在 结果 之 间 的 相关 和 方程 之 内 
或 之 间 可 能 存在 多 元 共 线性 时 ， 会 过 于 宽松 。 所 以 ,我 们 竟 力 主张 谨慎 地 检 
查 层 -2 自 变量 之 间 可 能 的 共 线性 ， 并 在 加 入 新 自 变 量 时 小 心地 监测 估计 的 
标准 误 。 

当 在 模型 中 加 入 层 - 1 的 固定 自 变量 时 ， 每 一 自 变量 的 组 内 相关 便 很 关 
键 。 如 果 这 一 相关 为 0 (比如 自 变量 是 以 组 平均 数 对 中 的 ) ， 应 用 10 例 规则 所 
对 应 的 总 观测 数 就 是 层 - 1 单位 的 总 数 。 与 此 相反 ， 当 组 内 相关 接近 于 1.0 
时 ， 可 以 加 入 的 层 -1 自 变量 数 会 受到 层 -2 单位 数 /的 约束 。 

如 果 用 分 层 分 析 来 做 一 个 探测 性 研究 ， 我 们 建议 将 层 -2 自 变量 划分 为 概 
念 上 不 同 的 子 集 ， 并 对 每 一 子 集 进行 子 模型 拟 合 。 然 后 ， 仅 将 这 些 子 模型 中 最 
重要 的 那些 自 变量 结合 到 总 模型 中 去 。 这 种 探测 方法 曾 被 Byk 和 Thum 
(1989) 用 于 检查 学 校 和 学 生 缺 席 与 退学 的 关联 。 

只 要 分 层 模型 既 包 含 随机 截 距 也 包含 随机 的 或 非 随机 变化 的 斜率 ， 分 析 人 
员 一 般 需 要 先 建立 一 个 关于 截 距 B。 的 尝试 性 模型 ， 然 后 再 拟 合 含 随机 斜率 的 
模型 。 这 类 似 于 在 一 般 线 性 模型 分 析 中 先 拟 合 主 效应 ， 再 考虑 交互 效应 。 在 分 
层 分 析 中 ,分 析 人 员 主 要 感 兴趣 的 交互 效应 是 层 间 的 ( 当然 ， 仅 在 层 - 1 或 层 
-2 的 互动 也 是 可 能 的 )。 
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指导 建立 层 -2 模型 的 经 验方 法 


是 否 应 该 将 某 个 层 -2 自 变量 加 入 模型 的 最 直接 的 证 据 是 看 其 估计 效应 的 
幅度 及 其 :检验 值 。 自 变量 的 1 值 如 接近 或 小 于 1， 就 应 该 把 它 从 模型 中 删除 。 


经 验 贝 叶 斯 残 差 的 分 析 

在 探测 性 分 析 时 ， 检 查 层 -2 的 经 验 贝 叶 斯 残 差 很 有 帮助 。 每 个 组 都 存在 
这 样 的 经 验 贝 叶 斯 残 差 (甚至 那些 有 缺陷 的 序 次 数据 也 一 样 ) ， 这 些 残 差 受 估 
计 误差 的 影响 小 于 OLS 残 差 所 受 的 同样 影响 〈 尽 管 OLS 残 差 也 可 以 用 来 分 
析 ) 。 

表 9.3 提供 了 层 - 2 模型 候选 的 学 校 层次 变量 分 别 与 经 验 贝 叶 斯 残 差 和 
OLS 残 差 之 间 的 简单 相关 系数 (这 些 残 差 基于 方程 9. 1 的 层 - 1 模型 和 一 个 无 
条 件 的 层 - 2 模型 计算 ) 。 注 意 ， 在 与 截 距 Bs 的 相关 系数 上 ， 经验 贝 叶 斯 与 
OLS 的 结果 非常 接近 。 在 的 可 靠 性 很 高 的 条 件 下 (第 4 章 已 报告 其 为 
0.91)， 这 种 结果 并 不 奇怪 。 但 是 ， 经 验 贝 叶 斯 残 差 与 变量 社会 经 济 状况 
(SES) 的 斜率 之 间 的 相关 却 比 基于 OLS 残 差 的 相关 要 强 得 多 。 与 B, 相 联系 的 
很 大 的 抽样 差异 (第 4 章 估计 的 B, 的 可 靠 性 为 0.23) 解释 了 OLS 残 差 低 得 多 
的 相关 系数 。 


R93 经 验 贝 叶 斯 残 差 和 OLS As (A-2) 与 其 他 学 校 层次 变量 之 间 的 相关 








HRH OLS 
学 校 层 次 的 线 选 变 映 RE SES 斜率 RE SES 斜率 
数学 课 平 均 选 课 数 0. 644 = 0.348 0. 643 -0.099 
学 校规 模 -0. 109 0. 187 -0.095 0. 109 
少数 种 族 比 例 -0.343 0.057 -0.340 -0.005 
数学 课 选 课 数 的 标准 差 -0.289 0.336 -0.277 0. 199 
学 业 项 目的 百分比 〈%) 0. 634 -0.334 0.630 0. 093 
FUR 0. 595 -0. 289 0. 597 -0.060 
RAH ~0. 469 0. 327 ~0, 472 0. 123 


ÌE: a OLS AIEI UL Ot FR I ADIT OR Ay BR 3. 49 和 3. 50 所 示范 的 程序 。 
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将 残 差 与 候选 层 -2 自 变量 做 标 绘图 还 可 以 帮助 识别 这 些 附 加 关系 的 随 数 
形式 。 图 9.3 标 绘 了 SES 斜率 的 经 验 贝 叶 斯 残 差 与 各 学 校 数 学 课 选 课 数 的 标准 
差 。SES 斜率 与 这 一 学 校 变量 存在 着 正 的 线性 关系 ( 表 9.3 说 明 其 + =0. 336), 
这 表明 ，SES 的 分 化 效应 ( 即 SES 的 斜率 ) 在 那些 数学 课 选 课 上 差别 很 大 的 
学 校 中 较 大 。 


SES 斜率 的 EB 残 差 
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图 9.3 SES 斜率 残 差 与 被 排除 变量 (MRAM HRM SD) 的 标 绘图 


与 此 类 似 ， 标 绘 这 些 残 差 与 尝试 性 模型 的 自 变量 也 可 以 提供 图 形 方式 
来 审查 每 一 层 -2 方程 中 结构 部 分 的 恰当 性 。 在 图 9.4 中 ， 由 表 9.1 中 第 1 
列 的 拟 合 模型 的 SES 斜率 的 经 验 贝 叶 斯 残 差 相对 MEAN SES 值 进行 了 标 绘 。 
由 于 MEAN SES 是 作为 SES 斜率 的 自 变 量 加 入 模型 的 ， 所 以 我 们 期 望 这 些 残 
差 为 方差 齐 性 地 随机 分 布 于 0 的 周围 。 关 于 MEAN SES 与 SES 斜率 之 间 为 线 
性 关系 的 假定 看 起 来 相当 合理 ， 只 有 一 个 例外 ， 即 标 绘图 中 被 圈 起 来 的 
案例 。 
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MEAN SES 


09.4 SES 斜率 的 经 验 贝 叶 斯 残 差 与 纳入 变量 (MEAN SES) 的 标 绘图 


近似 的 纳入 变量 : 统计 量 

另 一 种 检查 候选 的 层 - 2 模型 纳入 变量 的 方法 是 ， 对 Q + 1 个 方程 的 每 一 
个 都 用 其 经 验 贝 叶 斯 残 差 对 可 能 加 入 模型 的 WW 变量 做 一 个 简单 的 单 自 变量 的 
回归 。 用 这 种 方式 可 以 计算 出 一 个 近似 的 纳入 变量 上 统计 量 (标注 为 
tto-enter) ， 这 种 统计 的 一 个 示例 列 人 表 9. 2 中 的 最 后 一 部 分 中 。 这 种 纳入 上 统 
计 经 常 是 选择 W 变量 的 最 佳 指标 。 

尽管 基于 经 验 贝 叶 斯 残 差 的 回归 系数 比 基 于 OLS 残 差 的 回归 系数 更 好 ， 
它们 仍然 会 低估 W 变 量 实 际 加 入 模型 时 的 效应 。 池 亏 这 一 回归 系数 的 标准 误 
也 是 以 大 致 相当 的 比例 低估 的 ， 因 此 纳入 上 统计 通常 能 够 很 好 地 指示 可 能 的 后 
果 。 然 而 ， 这 种 统计 量 仅仅 是 近似 值 ， 因 为 模型 是 双重 多 元 的 ， 即 在 各 个 方程 
间 的 误差 相关 ， 每 一 个 方程 又 有 多 个 自 变量 。 因 此 这 种 统计 量 往往 只 是 对 将 要 
纳入 层 -2 方程 之 一 的 下 一 个 变量 具有 很 好 的 指标 作用 。 如 果 几 个 变量 要 同时 
加 入 模型 〈( 比 如 几 个 方程 各 加 一 个 变量 ) ， 实 际 后 果 也 许 并 不 遵循 这 种 统计 所 
建议 的 形式 。 


Fe -2 模型 设置 问题 


通常 假定 Q +1 个 层 -2 方程 的 每 一 个 都 做 了 适当 的 设置 。 也 就 是 说 ， 假 
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定 每 一 方程 的 误差 项 ww 都 与 同一 方程 中 的 白 变 量 无 关 。 这 意味 着 ， 任 何 省 略 
的 自 变 量 都 与 已 经 包括 在 这 一 模型 中 的 自 变量 无 关 。 这 一 假定 的 必然 结果 是 ， 
所 有 自 变量 ( 即 那些 W) 都 没有 测量 误差 。 

如 果 一 个 混杂 变量 〈 即 一 个 与 本 方程 中 己 有 的 层 -2 BERS AK SF 
的 自 变量 ) 在 这 些 方程 之 一 中 被 和 忽略， 那么 这 个 方程 对 一 个 或 多 个 层 -2 系数 
的 估计 将 会 有 偏 。 偏 差 幅度 依赖 于 这 一 省 略 变 量 的 预测 功效 ， 以 及 它 与 模型 中 
其 他 变量 之 间 的 相关 程度 。 

此 外 ， 对 一 个 方程 的 错误 设置 可 能 造成 其 他 方程 的 估计 有 偏 。 也 就 是 
说 ， 即 使 某 一 个 层 - 2 方程 本 身 是 适当 设置 的 ， 但 是 其 得 到 的 系数 估计 仍 
可 能 是 有 偏 的 。 这 一 偏差 是 那些 适当 和 不 适当 设置 的 方程 中 误差 之 间 存 在 
的 相关 导致 的 。 下 面 将 介绍 一 些 对 这 种 方程 之 间 偏 差 的 设置 检验 和 改进 
方法 。 


层 -2 错误 设置 的 后 果 

同样 ， 我 们 回 到 一 个 具体 例子 来 示范 这 一 问题 。 出 于 这 个 目的 ， 我 们 假定 
方程 9.1 和 9.2 为 适当 设置 的 。 因 此 ， 表 9. 4 中 的 第 一 列 也 就 作为 “正确 的 " 
估计 值 。 


表 9.4 错误 设置 效应 的 示范 





原 模型 GM MEAN SES 设置 检验 (HEN SES HR) 
系数 se 系数 se 系数 se 
模型 ;学校 平 均 数 ，Bw 
RE. Yo 13.73 0. 20 12. 90 0. 23 12,90 0. 23 
MEAN SES, yo, 4.54 0.48 一 一 一 一 
SECTOR, yo 0.83 0. 20 1.56 0.23 1,56 0.23 
模型 :学校 SES HE, p, 
RE, yo 1.78 0. 16 1.82 0. 16 1. 80 0.15 
MEAN SES, y,, 0.68 0.38 0.93 0.38 0.73 0. 34 
SECTOR, yp -0.58 0.16 -0.62 0.16 -0.61 0.14 





假定 MEAN SES 被 错误 地 从 截 距 模 型 中 省 略 。 这 种 错误 设置 的 结果 列 在 
表 9.4 的 第 2 组 中 。 因 为 MEAN SES 和 SECTOR 之 间 正 相关 ， 删除 MEAN 
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SES 导致 截 距 方程 中 的 SECTOR 效应 被 高 估 ， 由 0.83 升 为 1.56， 高 估 约 为 
2 倍 。 此 外 ， 如 上 所 述 ，SES 斜率 模型 中 的 估计 也 受到 了 影响 。MEAN SES 
的 系数 y,, 现 在 膨 胀 了 约 40% ， 从 0.68 扩大 为 0.93。 这 个 截 距 模 型 的 错误 
设置 导致 斜率 模型 也 出 现 了 事 曲 ， 它 的 发 生 是 由 于 这 两 个 模型 的 误差 是 相 
关 的 。 


一 种 设置 检验 

如 果 在 Bu 和 ,之 间 的 抽样 协 方差 与 在 Bu 和 ,之 间 的 真 值 协 方差 的 合计 为 
0， 那 么 截 距 方程 和 和 斜率 方程 的 系数 估计 之 间 便 是 独立 的 (因此 不 受 其 他 方程 
的 设置 误差 的 影响 ) 。 虽 然 在 实践 中 很 少 能 满足 这 一 条 件 ， 分 析 人 员 仍 可 以 将 
此 作为 模型 设置 的 检验 基础 。 具 体 而 言 ， 将 层 - 1 自 变量 以 其 单位 平均 数 对 中 
可 以 保证 截 距 上 的 抽样 协 方差 为 0， 将 其 斜率 的 误差 项 约 东 为 0 可 以 将 斜率 和 
截 距 参 数 之 间 的 协 方差 设 为 0。 这 可 以 提供 一 种 设置 审核 ,检查 层 -2 每 一 个 
方程 的 估计 是 否 受到 其 他 方程 错误 设置 的 重 曲 。 

表 9.4 的 最 后 一 组 提供 了 这 种 设置 审核 ， 其 中 SES 斜率 模型 的 残 差 方差 已 
经 被 设 为 0。 尽 管 学 校 平均 数 模型 由 于 省 略 了 MEAN SES 而 存在 严重 的 设置 错 
误 ， 注 意 ，SES 斜率 模型 的 y 估计 却 并 不 像 第 3 列 被 焉 曲 得 那样 严重 。 第 3 列 
和 第 5 列 结果 不 同 的 事实 表明 ， 第 3 列 对 应 的 模型 可 能 有 错误 设置 。 但 是 ， 我 
们 需要 注意 ， 在 模型 中 将 层 -2 的 一 个 方差 约束 为 0 的 方法 只 能 作为 一 种 设置 
检验 来 用 (假定 相应 的 方差 分 量 其 实 并 不 是 0) 。 通 过 将 残 差 方差 设 为 0， 我 们 
将 高 估 y 系数 的 精度 。 注 意 ， 第 6 列 的 斜率 模型 的 y 的 标准 误 都 虚假 地 小 于 第 
2 列 的 相应 估计 。 


一 种 改进 策略 

一 个 适当 设置 的 层 - 2 方程 会 由 于 其 他 层 - 2 方程 的 错误 设置 以 及 这 两 个 
方程 之 间 的 误差 相关 而 导致 估计 有 偏 。 但 是 这 种 估计 偏差 在 所 有 Q + 1 个 方程 
中 都 被 纳入 同样 一 组 自 变量 时 便 可 以 避免 。 正 规 地 说 ， 如 果 每 一 个 方程 都 被 纳 
人 同样 的 自 变量 集 并 且 如 果 数 据 是 完全 平衡 的 〈 即 每 个 学 校 都 有 同样 的 样本 
规模 和 同样 一 套 SES 值 ) JE ~ 2 斜率 模型 中 的 系数 估计 将 独立 于 截 距 模 型 中 
的 系数 估计 。 即 使 当 数据 不 平衡 时 ， 斜 率 模型 的 估计 也 将 是 渐 近 地 独立 于 截 距 
模型 的 估计 ， 并 且 它们 将 是 渐 近 无 偏 的 。 


9 评价 分 层 模 型 的 恰当 性 259 


在 许多 研究 中 ， 分 析 者 并 不 想 将 0 + 1 个 方程 中 任何 一 个 的 每 个 WW 强加 于 
所 有 Q +1 个 方程 中 去 (出 于 简约 的 要 求 以 及 计算 机 的 限制 )。 至 少 ， 研 究 人 
员 应 该 审核 一 下 那些 被 纳入 层 -2 方程 之 一 但 又 不 包括 在 其 他 方程 中 的 变量 是 
不 是 真 的 不 显著 。 应 用 以 上 所 介绍 的 经 验 贝 叶 斯 残 差 来 进行 探测 性 分 析 可 以 对 
此 提供 有 用 的 审核 。 


层 -2 自 变量 的 测量 误差 

测量 误差 可 以 被 视 为 一 种 特殊 形式 的 错误 设置 问题 (参见 本 章 附 录 ) ， 因 
此 ， 以 上 描述 的 所 有 关注 也 适用 于 可 能 有 错 的 层 -2 自 变量 。 总 的 来 说 ， 如 果 
一 个 层 -2 自 变量 测量 有 误 ， 它 的 系数 以 及 其 他 层 -2 系数 可 能 也 是 有 偏 的 。 
偏差 的 程度 取决 于 真实 自 变 量 的 解释 功效 、 测 量 不 可 靠 性 的 程度 以 及 自 变 量 之 
间 的 相关 情况 。 

第 11 章 提供 了 一 些 方法 ， 通 过 采用 潜在 变量 模型 来 结合 对 层 - 2 自 变量 
测量 误差 的 知识 。 对 这 些 自 变量 建立 明确 的 测量 模型 有 助 于 控制 层 -2 系数 估 
计 中 的 偏差 。 


检查 关于 层 -2 随机 效应 的 假定 


同 质 性 

我 们 一 般 都 假定 层 - 2 随机 效应 在 各 了 个 单位 的 离散 度 是 相同 的 。 比 如 
就 高 中 及 以 上 学 校 的 数据 分 析 而 言 ， 如 果 天 主教 学 校 比 公立 学 校 的 变量 随机 效 
应 要 小 ， 便 是 违反 了 这 一 假定 〈 附 带 说 明 ， 这 种 类 别 差异 很 可 能 正 是 实际 研 
究 的 关注 点 ) 。 

就 固定 效应 而 言 ， 不 适当 地 假定 同 质 性 的 后 果 是 ， 在 估计 这 些 效 应 时 不 
能 达到 最 优 的 加 权 ， 最 终 导 致 统计 效率 的 损失 。 但 是 ， 层 -2 系数 估计 仍然 
是 无 偏 的 。 就 随机 效应 而 言 ，B” 的 收缩 将 是 错误 的 ， 并 导致 B 估计 的 均 方 
误 扩 大 。 

T 的 离散 度 相等 可 以 根据 替代 假设 来 进行 正规 检验 。 比 如 ， 可 以 对 天 主 
教学 校 和 公立 学 校 按 类 别 估 计 出 分 别 的 下 和 矩阵。 这 将 附加 估计 m(m +1) /2 
个 方差 协 方差 分 量 ， 可 以 应 用 似 然 比 检验 来 检查 这 两 个 T 矩阵 是 否 相等 。 至 
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于 如 何 探索 这 类 不 相等 的 来 源 其 实 十 分 类 似 于 以 上 关于 o SE tE DA i 
过 程 。 


TE 

固定 效应 的 估计 不 会 由 于 层 -2 正 态 性 假定 的 违反 而 有 偏 。 然 而 ， 如 果 层 
-2 的 随机 效应 有 厚 尾巴 ， 那 么 基于 正 态 性 的 假设 检验 和 置信 区 间 将 会 对 异常 
值 十 分 敏感 。 违 反正 态 性 假定 将 影响 到 固定 效应 的 置信 区 间 和 假设 检验 的 有 效 
性 。 这 些 效应 的 本 质 取决 于 随机 效应 分 布 的 真实 形态 。Seltzer (1993) 讨论 了 
可 能 发 生 焉 曲 的 类 型 。 

审核 层 -2 正 态 性 由 于 层 -2 结果 Bu 并 不 是 直接 观测 的 事实 而 复杂 化 。 
可 以 标 绘 出 经 验 贝 叶 斯 残 差 ， 从 标 绘图 中 可 以 检查 异常 值 。 此 外 ， 也 能 够 
估计 它们 的 边际 方差 ， 因 此 可 以 对 其 标准 化 ， 并 与 标准 正 态 分 布 的 正 态 
序列 统计 量 的 期 望 值 进 行 对 比 。 但 是 ， 当 每 一 组 的 样本 规模 m 很 小 时 ， 
这 些 方 差 估 计 将 十 分 不 确定 ， 以 至 于 标准 化 残 差 的 真实 方差 也 许 会 稍微 
AT h 

使 审核 正 态 性 假定 复杂 化 的 原因 是 ，0 + 1 个 相关 的 随机 效应 也 许 是 按 各 
单位 估计 的 。 对 每 一 单位 计算 一 个 马 氏 距离 (Mahalanobis distance measure ) 
有 助 于 评价 随机 效应 与 正 态 性 的 偏离 程度 ， 并 能 发 现存 在 的 异常 值 。 这 种 统计 
量 是 以 这 一 模型 的 期 望 距 离 为 基准 测量 的 每 一 组 残 差 估计 的 相对 距离 .0 在 层 
-1 样本 足够 大 时 ， 要 是 数据 具有 正 态 分 布 ， 那 么 这 一 统计 量 将 服从 自由 度 为 
Q +1 的 x 分 布 。 将 观测 的 距离 统计 相对 期 望 序列 统计 画 出 标 绘图 ， 可 以 从 图 
中 检查 对 正 态 性 可 能 的 偏离 。 此 外 ， 还 可 以 识别 出 异常 单位 ， 以 便 做 进一步 的 
检查 。 

图 9.5 中 提供 了 对 两 个 不 同 模型 所 做 的 马 氏 距离 标 绘图 。 第 一 个 标 绘图 来 
自 一 个 具有 随机 的 截 距 和 SES 斜率 的 层 - 1 模型 。 第 二 个 标 绘图 的 模型 中 又 附 
加 了 一 个 随机 的 学 业 背 景 (ACADEMIC BACKGROUND) 斜率 。 两 个 模型 都 显 
得 大 致 是 正 态 的 。 


(DRM Hs u "Vj 'u*， 其 中 uw” 是 对 单位 j 的 随机 效应 向 量 由 的 经 验 贝 叶 斯 估计 ， 
是 这 一 向 最 误差 离散 情况 :其 定义 为 : Wi =o (XIX,) -+T-Var(Wi7)， 其 中 Var (W9) 
是 Wy 中 P+1 个 元 素 的 离散 矩阵 。 
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_ 层 -1 模 弄 中 有 截 距 (BASE) 和 随机 的 SES 斜率 








马 氏 距离 
层 -1 BO) A ARE (BASE) 和 随机 的 SES 与 学 业 背 景 的 斜率 
T 





r-r 





马 氏 距离 


图 9.5 检查 正 态 假定 的 马 氏 距离 标 绘图 


如 果 层 -2 发 生 了 严重 的 非 正 态 性 ，Seltzer (1993) 研制 的 程序 将 会 有 帮 
助 , 特别 是 在 层 ~ 2 的 随机 效应 有 厚 尾 巴 时 ，Seltzer 曾经 示范 了 Tanner 和 
Wong (1987) 的 数据 增 广 (data augmentation) 方法 能 够 用 来 估计 分 层 线性 模 
型 。 他 的 结果 还 显示 出 ， 一 个 对 层 -2 随机 效应 的 “预先 :”(4 prior) 检验 可 
以 提供 对 固定 效应 的 稳健 估计 。 这 些 估 计 对 层 -2 的 异常 值 不 太 敏感 。 


稳健 标准 误 


在 许多 研究 中 ， 研 究 人 员 的 首要 兴趣 在 于 固定 的 系数 ， 标 志 为 y。 在 分 层 模 
型 的 标准 应 用 中 ， 关 于 这 些 固定 系数 的 推断 在 一 定 程度 上 取决 于 各 层 随 机 效应 分 
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析 的 假定 。 如 果 因 为 关于 随机 效应 的 假定 不 符合 实际 而 严重 地 牌 曲 了 关于 固定 效 
应 的 推断 ， 那 将 是 令 人 遗憾 的 。 为 了 检查 固定 效应 推断 对 随机 效应 假定 条 件 的 敏 
感性 ， 党 常 计 算 稳 健 的 或 “Huber- 矫 正 ” (Huber-corrected) 的 标准 误 。Liang 和 
Zeger (1986) 曾 就 应 用 非 线性 模型 于 历时 分 析 的 情况 讨论 过 这 些 问 题 。 应 用 这 
些 稳健 标准 误 在 最 高 一 层 的 单位 数量 很 大 时 最 合适 。 这 类 标准 误 的 计算 既 可 以 
结合 常规 最 小 一 乘法 (OLS)， 也 可 以 结合 分 层 线性 模型 的 固定 效应 估计 。 

在 OLS 下 的 稳健 标准 误 。 为 了 理解 稳健 标准 误 背 后 的 逻辑 ， 我 们 来 考虑 
一 个 只 有 一 个 自 变量 ,的 两 层 模 型 。 组 合 模型 为 : 


Y= +nXy te, faa) 
或 者 ， 用 矩阵 符号 表示 ， 
Y; 1X, e; 
(i) i | i Falta (:) [9.8] 
或 者 ， 更 简练 地 表示 为 : 
Pe eens [9.9] 


在 OLS 假定 和 正 态 性 条 件 下 ， 我 们 有 : 


e, ~ N(0,o°l, ) [9. 10] 
证 明 OLS 估计 量 : 
J ad 
y= (Xxx) EXX, [9.11] 


为 了 推导 这 一 估计 量 的 方差 ， 我们 回想 ， 如 果 C 是 一 个 常量 矩阵 ，2 是 一 个 随机 向 
ft, 那么 有 Var(CZ) =C Var(Z)C"。 将 这 一 恒等式 应 用 于 方程 9. UM, A: 


Var(P = (Sx) Zivac] 人 — [9.12] 
在 OLS 假定 条 件 下 ，Var(Y) =o 1， 因此 方程 9. 12 简化 为 : 


J 上 
Var(¥) = ll Sy [9.13] 
jal 
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然而 ， 我们 设想 ， 如 果 OLS 假定 条 件 不 真有 旦 了 的 方差 有 某 种 未 知 结构 ， 
我 们 可 以 利用 一 个 事实 ， 即 每 一 层 -2 单位 了 提供 一 个 近似 于 无 偏 的 佑 
itt: 

Var(¥,) = (Y, -XP)(Y, - Xy)" [9.14] 
以 推导 出 稳健 方差 估计 量 : 


i 
4 

Var(¥) = (Exx,) DY XY, - x7) «x's | Bx | [9.15] 
= ro 


set at 


这 一 估计 量 有 依 / 的 一 致 性 ， 也 就 是 说 ， 即 使 在 OLS KF 。 的 假定 不 真 
时 ， 当 J 无 限 增加 ， 这 一 估计 基 收 敛 于 真实 的 标准 误 。 此 外 ， 当 J 很 大 时 ， 
有 : 


(in = Ya) / (Vary, 1!" [9.16] 


为 近似 正 态 分 布 ， 平 均 数 为 0 且 方 差 等 于 1。 这 使 得 我 们 即使 在 残 差 ,不 是 正 
态 分 布 的 情况 下 也 可 以 计算 合理 的 丫 信 多 间 和 统计 检验 。 

在 GLS 下 的 稳健 标准 误 ， 在 分 层 线性 模型 中 ，y 系数 估计 是 一 般 最 小 二 乘 
法 (GLS) 估计 量 。 设 想 在 模型 (方程 9.7) 中 的 残 差 实际 上 为 : 


ey = lg + LX + es [9.17] 


或 者 ， 用 矩阵 符号 表示 为 : 
e, = Xu +e, [9.18] 
RE, u 是 层 -2 随机 效应 的 向 量 。 标 准 的 分 层 线性 模型 的 假定 条 件 是 : 
u, = NOT, ¢, ~ N(0,0°l,) {9.19} 
所 以 ， 
Var(¥,) = Var(Xu, + 6) = V; = XTX Yo [9.20] 
在 这 些 假 定 及 正 态 性 的 条 件 下 ， 我 们 有 GLS 估计 量 ; 


4 i 
Y=( LXV, X) Davy, (9. 21] 
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将 所 计算 的 GLS fait ACH BO. 21 PAT Mo’ 的 估计 ， 那么 这 一 估计 基 的 
近似 方差 为 ; 


J i i 
Var(¥) = (EXV XD x DXV TIVarY)]XVT (YXTVTX) [9.22] 
在 GLS 假设 条 件 下 ，Var( Y,) = Vi,， 于 是 方程 9. 22 简化 为 : 
i 
Var(y) = (> XVX) [9.23] 
ji 


然而 ,假如 GLS 假定 不 真 ， 并 且 Y 的 方差 有 某 种 未 知 结构 ， 我 们 能 推导 出 一 
个 稳健 方差 估计 量 : 


— 了 J 2 
Var(y) = (EXV XD x DXV'(Y, -XY) 
set ja 
了 
O, -XDXV UE XV) [9.24] 


这 一 在 GLS 条 件 下 的 稳健 方差 估计 量 有 依 J 的 一 致 性 ， 即 使 在 HLM 关于 随机 
效应 的 分 布 与 协 方差 结构 的 假定 不 正确 时 ， 只 要 J 很 大 ， 也 能 提供 基本 的 置信 
区 间 和 假设 检验 。 

稳健 方差 估计 十 分 有 助 于 诊断 。 分 析 人 员 能 够 检查 以 模型 为 基础 的 指标 与 
稳健 标准 误 之 各 的 差距 。 如 果 差 距 很 大 ， 即 表示 模型 被 错误 设置 了 。 比 如 ， 当 
存在 斜率 异 质 性 而 并 未 在 建 模 时 加 以 考虑 时 ， 就 会 发 现 以 模型 为 基础 的 指标 与 
稳健 标准 误 之 间 的 差距 。 在 这 种 情况 下 ， 在 模型 中 体现 斜率 异 质 性 可 以 消除 这 
一 差距 。 
示范 

我 们 回 到 应 用 高 中 及 以 上 学 校 数据 的 方程 9.1 和 9.2 所 定义 的 模型 ， 其 组 
合 模 型 为 ; 

Y, = Yo + Yn (MEAN SES), + Yy (SECTOR), + yn (SES), 
+ yn (MEAN SES), x (SES), + yp (SECTOR), x (SES), (9. 25] 


+ Ug, + u, (SES), +E, 


ROS 提供 了 4 种 估计 及 其 标准 误 : (a) OLS 估计 及 其 以 OLS 模型 为 基础 的 标 


viwe 
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WEIR: (b) OLS 估计 及 其 稳健 标准 误 ; (e) HLM 估计 及 其 以 模型 为 基础 的 标 
EUR; (d) HLM 估计 及 其 稳健 标准 误 。 对 这 4 组 结果 的 比较 得 到 以 下 认识 ;: 

1. OLS 和 HLM XF y 系数 的 点 估计 相当 近似 。 在 J = 160 比较 大 的 情况 
下 ， 这 种 结果 不 足 为 奇 。 

2. OLS 对 截 距 的 自 变量 的 模型 标准 误 估计 大 大 小 于 相应 的 稳健 标准 误 。 具 
体 而 言 ， 对 于 SECTOR 与 学 校 截 距 ( 见 yo,) 之 间 的 联系 ， 基 于 模型 的 估计 是 
0. 158， 差 不 多 仅 是 稳健 标准 误 0. 299 的 一 半 。 这 说 明 ， 因 为 OLS 模型 基于 失 
实 的 假定 之 上 ， 即 认为 学 校 之 间 在 随机 效应 uw。 上 没有 差异 。 但 其 实 
Var(uw) =rm 估 计 值 很 大 且 统 计 性 高 度 显著 ， 于 是 OLS 假定 导致 标准 误 的 估 
计 严 重 偏 低 。 与 此 相 比 ， 稳 健 标 准 误 并 不 基于 这 一 假定 ， 因 此 便 将 这 种 校 际 差 
异 带 人 其 估计 中 。 

3. OLS 对 自 变量 SES 斜率 估计 的 模型 标准 误 与 稳健 标准 误 的 差别 不 大 。 具 
体 地 说 ， 对 于 SECTOR 与 SES 斜率 (Wyn) 之 间 的 联系 ， 基 于 模型 的 估计 是 
0. 240， 与 稳健 标准 误 0. 237 几乎 相同 。 这 说 明 ，OLS 模型 的 假定 是 学 校 之 间 
在 随机 效应 wu 上 无 差异 。HLM 的 结果 证 实 了 这 一 假定 .回想 当时 的 分 析 并 没 
有 拒绝 虚无 假设 Var(u,,) =ru =0， 所 以 ， 对 于 SES 斜率 ， 这 一 OLS 假定 在 数 
据 中 得 到 支持 ， 并 且 有 OLS 模型 的 标准 误 与 稳健 标准 误 一 致 

4. HLM 模型 标准 误 与 稳健 标准 误 之 间 相 当 吻 合 ， 而 且 与 基于 OLS 的 稳健 
标准 误 也 相当 吻合 。 因 此 ， 稳 健 标准 误 并 未 说 明 HLM 被 错误 设置 。 这 并 不 是 
说 HLM 的 假定 是 正确 的 ， 而 仅 意 味 着 这 些 标准 误 对 HLM 关于 残 差 的 协 方差 结 
构 假 定 上 的 任何 错误 并 不 敏感 。 


表 9.5 对 固定 效应 的 以 模型 为 基础 的 方差 估计 和 稳健 方 妾 估计 * 








(a) (b) 
系数 OLS 系数 OLS 模型 的 se OLS 稳健 的 se 
模型 :学校 平均 数 ，P。， 
RE, Yo 12. 08 0. 107 0.170 
MEAN SES, yo 5.16 0.191 0. 334 
SECTOR, Yo 1.28 0. 158 0.299 
模型 : 学 校 SES HK, B, 
KH, Yio 2.94 0. 155 0. 148 
MEAN SES, y,, 104 0. 300 0. 333 


SECTOR, yn ~ 1. 64 0. 240 0.237 
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BRIS 
(c) (d) 
RM HLM 系数 _ HLM 模型 的 se HLM 稳健 的 se 
模型 :学校 平均 数 ，pu 
RF. Yo 12. 10 0. 199 0. 174 
MEAN SES, Yo 5.33 0. 369 0.335 
SECTOR, yo 1.23 0. 306 0. 308 
MB. 学校 SES BE, A, 
MR. yo 2.94 0. 157 0. 148 
MEAN SES, y,, 1.03 0. 303 0.333 
SECTOR, yn -1.64 0. 243 0.237 





注 ; a 注意 ， 本 表 中 变量 SECTOR 的 样本 和 编码 方法 均 与 第 4 (R45) 相同 ， 但 是 与 表 9.1 有 
所 不 同 。 这 一 差别 对 本 示范 并 无 影响 


在 样本 为 小 样本 时 推断 的 有 效 性 


在 数据 完全 平衡 的 特殊 情况 下 ,了 对 固定 效应 推断 的 小 样本 理论 才能 成 
立 。 比 如 ， 一 个 固定 效应 的 估计 值 除 以 其 标准 误 将 严格 遵循 + 分布。 对 固定 效 
应 的 精确 推断 在 平衡 的 情况 下 是 可 能 的 ， 因 为 固定 效应 的 点 估计 不 依赖 于 方差 
分 量 。2 

在 不 平衡 的 情况 下 ， 找 们 依靠 大 样本 理论 。 固 定 效 应 的 估计 及 其 标准 误 依 
赖 于 模型 中 每 个 方差 协 方差 分 量 的 点 估计 。 由 于 固定 效应 的 点 估计 与 方差 协 方 
差分 量 的 点 估计 之 间 的 相关 ， 这 些 估计 结果 的 精确 抽样 分 布 是 未 知 的 。 然 而 ， 
当 应 用 最 大 似 然 估 计时 ， 最 大 似 然 估计 的 大 样本 性 质 是 已 知 的 。 本 节 的 问题 
是 : 大 样本 分 布 理论 在 多 大 程度 上 有 效 ? 


中 ”完全 平衡 案 例 是 一 种 极端 约束 性 的 设置 。 在 两 屋 的 分 层 中 ， 必 须 满 足下 列 条 件 才能 保证 数据 完 

全 平衡: 

a 各 单位 的 样本 规模 必须 相等 。 

b， 每 一 单位 之 内 必须 有 隔 样 的 一 套 层 - 1 自 变量 值 。 

6c， 在 Q+1 个 层 -2 方程 中 的 每 一 个 中 都 应 用 同一 套 自 变量 。 

d. E -1 和 层 -2 的 方差 分 最 必须 在 每 一 单位 中 都 相同 。 
O 在 平衡 情况 下 ， 层 -2 襟 型 是 一 个 经 典 的 多 元 线性 模型 ， 其 中 对 每 一 个 单位 的 回归 系数 可 以 视 为 
独立 且 相 同 地 服从 多 元 正 态 分 布 的 结果 向 量 : B= Wiy +u +e, a +e, ~M(0, 5). HPE = 
中 (XX) AT. 在 估计 y 时 用 不 着 o? 和 卫 的 点 估计 ， 凡 为 OLS 估计 量 了 = (EWW) E 
WIBB 也 是 ?的 最 大 似 然 估计 。 了 和 工 的 相互 独立 成 为 关于 y 的 线性 仍 设 的 精确 亚 检 验 的 基础 。 
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对 某 一 个 研究 来 说 ， 这 一 答案 取决 于 所 寻求 的 推断 。 下 面 我 们 来 考虑 对 固 
定 效应 (d— MT) 以 及 随机 效应 下 的 估计 。 为 了 阐明 基 
本 原理 并 澄清 其 逻辑 关系 ， 我 们 用 一 个 单 因素 随机 效应 的 方差 分 析 (ANOVA) 


对 固定 效应 的 推断 


不 管 样本 的 规模 大 小 ， 固 定 效应 的 估计 是 无 偏 的 。 然 而 ， 在 不 平衡 的 情况 
下 ， 园 定 效应 的 标准 误 估计 一 般 都 过 小 ， 基 于 标准 正 态 分 布 的 假设 检验 也 就 过 
于 散漫 。 

在 单 因素 随机 效应 ANOVA 模型 中 ，yw 的 点 估计 来 自 方程 3.9: 


Fo = LV, +i WA EV, tt)" (9. 26] 
其 中 : 
A = on, 
Y = br/n, 
所 估计 的 ym 的 标准 误 为 ; 
LO iw)" = [Ei] [9.27] 


值得 注意 的 是 ， 总 的 来 说 ，yw 的 点 估计 及 其 标准 误 估计 是 0? 和 rm 估计 的 
函数 。 但 是 ， 在 平衡 的 情况 下 便 不 是 这 样 ， 有 : 


tm SI (9. 28] 


显然 ， 在 平衡 的 情况 下 ，ym 不 依赖 于 o M ros HIP, Vi yu) 只 需要 一 个 估 
TEV + ro ， 而 不 用 分 别 估计 其 分 量 [通常 ，Y + rm 的 估计 就 是 组 间 的 均 方差 
(MS between) 再 除 以 n]。 

因此 ， 在 平衡 的 情况 下 ， 


(F - Yo)/(MS between/nJ) ‘7 [9. 29] 


在 虚无 假设 Hu:y = yo 条 件 下 服从 自由 度 为 J-1 的 :分 布 。 
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但 是 在 不 平衡 的 情况 下 ， 不 存在 这 样 的 精确 检验 。 然 而 我 们 可 以 说 ， 如 果 
cx 和 rm 是 通过 最 大 似 然 法 估计 的 ， 那 么 统计 量 : 


Z=(7- 加 ERF7) 1"? [9.30] 


的 大 样本 分 布 为 标准 正 态 分 布 . 但 是 在 实践 中 ， 应 用 上 分 布 参照 更 为 合适 。 
Fotiu (1989) 模拟 过 不 平衡 数据 ， 用 一 套 假设 的 小 样本 进行 班级 研究 ， 其 中 
每 一 个 班 的 截 距 和 斜率 依赖 于 这 个 班 在 实验 组 或 控制 组 的 分 配 。 他 的 研究 结果 
显示 ， 应 用 : 分布 作为 参照 能 比 应 用 标准 正 态 分 布 提供 更 为 准确 的 对 固定 效应 
的 假设 检验 。 

其 次 ，V(Yw) 估计 有 负 偏 差 。ym 的 真实 方差 应 该 是 : 


Var( Foo) = E。[Var(7m1im,0:)] + Var [E Cfo l Fo.0°)] [9.31] 


Sith, WM EL 与 方差 Var, 从 ty Alo? 的 联合 分 布 中 得 到 ，E. 与 方差 Var 
从 7m 在 给 定 7。 和 ?时 的 条 件 分 布 中 得 到 。 第 二 项 是 最 大 似 然 估计 的 偏差 ， 在 
平衡 的 情况 下 为 0， 在 不 平衡 的 情况 下 ， 当 J 增加 时 将 收 剑 于 0。 甚 至 在 许多 
小 样本 的 场合 (要 是 不 平衡 不 太 严重 的 话 ) ， 这 一 项 的 值 将 非常 小 。 

层 -2 的 样本 规模 / 为 中 小 型 时 ， 决 定 V (oq) 偏差 规模 的 关键 影响 因素 
是 Yo 对 差别 权重 的 敏感 性 。 回 想 方 程 9 26，7 加 估计 是 基于 (Y + 知 ) "之 上 的 
一 个 加 权 平 均 数 。 当 rm 趋 近 于 0 时 ， 这 些 权 数 趋 近 于 mV ， 且 yp RUE FIM 
权 平均 数 忆 nj 了/ Eno SHAR, UFO MM ty. Yo = TAY, ZA, HP 
Ay=Te0/ [ro +(o7/n,))] o Alt, 4S roi et, A, 趋 近 于 1, A 7H DER 
术 平 均 数 于 7,/ J。 如 果 加 权 平 均 数 王 n,7,/ Dn, 与 算术 平均 数 差别 很 大 ， 那 么 
方程 9. 31 中 的 偏差 项 就 会 很 大 ， 并 且 对 Y(3w ) 的 分 层 估计 将 会 过 小 。 如 果 这 
些 加 权 的 和 未 加 权 的 平均 数 很 近似 ， 那 么 说 明 对 V( o) 的 分 层 估计 近乎 于 
无 偏 。 

这 一 分 析 导 致 以 下 几 个 一 般 建议 ，; 

1. 在 检验 关于 y 的 假设 时 应 该 用 ! 分 布 而 不 是 用 正 态 分 布 。 

2. 检查 了 估计 对 加 权 方 式 的 敏感 性 。 如 果 这 些 估计 对 加 权 方 式 不 敏感 ， 
RAHV) 作为 标准 误 估计 。 

3. 如 果 这 些 结果 对 加 权 方 式 很 敏感 ， 基 于 (>) 的 + 检验 应 视 为 过 于 散 
温 。 通 过 贝 叶 斯 方法 可 以 求 精确 的 解 。 贝 叶 斯 估计 需要 做 大 量 计算 ， 在 估计 y 
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类 参数 及 其 标准 误 时 充分 考虑 了 和 了 的 不 确定 性 (Seltzer, 1993)。 参 见 第 
13 章 的 详细 讨论 。 


对 方差 分 量 的 推断 


对 方差 分 量 o* 和 了 的 推断 依赖 于 最 大 似 然 估计 的 大 样本 性 质 。 从 技术 上 
讲 ， 标 准 误 和 假设 检验 都 建立 在 “信息 矩阵 ”的 基础 上 (参见 第 10 章 ) 。 
的 点 估计 在 多 数 研究 中 一 般 都 相当 准确 。 如 果 假 定 ez 在 各 单位 都 相同 ， 那 么 
其 估计 的 精度 取决 于 总 样本 规模 (N= Zm)， 它 在 一 般 情况 下 都 很 大 。 与 此 
类 似 ， 对 aè 的 似 然 比 检验 和 标准 误 也 将 比较 准确 。 

但 是 ， 如 打假 定 of 在 各 层 - 2 单位 之 间 变 化 ， 就 会 产生 问题 。 关 键 在 于 
观测 数量 a,， 因 为 要 基于 它们 来 估计 o?。 在 这 类 研究 中 ， 每 一 单位 内 部 的 样 
本 规模 应 该 很 大 。 另 一 方面 ， 如 果 对 两 种 学 校 类 型 (比如 天 主教 学 校 与 公立 
PR) 估计 oa? Mo}, 这些 a> 的 估计 准确 性 及 其 推断 的 可 信 性 将 取决 于 每 一 
类 型 中 的 总 样本 规模 。 

T 估计 的 准确 性 取决 于 层 - 2 的 单位 数量 J。T 中 各 方差 的 标准 误 基于 信 
BER, BOR 很 大 才能 保证 可 信和 度 ， 尤 其 是 当 方差 估计 值 接近 于 0 的 时 候 。 

MLR 对 比 MLF。 在 第 2 章 ， 我们 介绍 了 完全 的 和 约束 的 最 大 似 然 法 。 我 
们 注意 到 ， 当 /很 小 时 ，MLF 对 了 矩阵 的 估计 存在 负 偏 差 ， 并 且 当 模型 中 的 
团 定 效应 数目 增加 时 ， 这 一 问题 会 更 严重 。 然 而 ， 根 据 期 望 均 方 误 来 判断 ， 虽 
然 MLF 估计 有 偏 ， 但 并 不 一 定 比 MLR 估计 的 准确 性 更 差 。 

检验 的 类 型 。 第 2 章 还 介绍 了 对 T 矩阵 元 素 的 三 种 检验 HRY 检验 、 
基于 某 一 估计 与 其 标准 误 的 比率 的 单 变量 检验 以 及 似 然 比 检验 ， 后 者 通常 是 多 
元 检验 (因为 它 同 时 检验 2 个 或 更 多 的 了 和 矩阵 元 素 ) 。 每 一 种 检验 都 基于 大 样 
本 理论 。 但 是 ,我 们 的 经 验 表明 ， 当 样本 规模 很 小 时 ， 用 T 和 矩阵 元 素 的 估计 
标准 误 所 做 的 检验 最 不 可 信 。 这 种 检验 的 基本 概念 是 ， 以 这 一 估计 自己 为 中 心 
来 建立 置信 区 间 。 只 有 在 似 然 值 关 于 其 众 数 对 称 时 ， 这 种 检验 才能 提供 有 效 信 
息 。 但 是 在 许多 场合 ， 似 然 值 是 高 偏 度 分 布 的 ， 特 别 是 当真 实 方差 很 小 时 便 更 
是 这 样 ， 而 这 时 正 是 最 需要 这 种 检验 的 时 候 。 总 而 言 之 ， 方 差分 量 值 越 小 ， 就 
越 需要 更 多 的 数据 来 证 明 其 近似 大 样本 的 正 态 性 ， 因 为 这 种 检验 正 是 建立 在 此 
基础 之 上 。 
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在 应 用 似 然 比 检验 虚无 假设 H。:7,, =0 时 ， 即 假设 所 有 方差 分 量 都 等 于 0 
时 ， 也 要 小 心 。 在 这 种 具体 情况 下 ， 依 这 一 假定 ， 方 差 值 处 于 参数 空间 的 边界 
上 ， 似 然 比 统计 会 倾向 于 保守 (Pinheiro & Bates，2000) ， 降 低 了 拒绝 一 个 不 
真实 虚无 假设 的 几率 ,了 这 种 问题 在 第 3 章 描述 的 单 变量 x* 检验 (见方 程 
3. 103) 中 并 不 存在 。 我 们 的 经 验 表 明 ， 在 大 多 数 研究 中 ， 这 两 种 检验 的 结果 
很 接近 。 

对 T 中 各 元 素 的 所 有 检验 渐 近 地 取决 于 J。 也 就 是 说 ， 即 使 在 各 单位 m 中 
的 样本 规模 是 无 限 的 ， 这 种 检验 也 只 有 在 单位 数目 /很 大 时 才 是 正确 的 。 然 
而 ,还 需要 更 多 的 研究 才能 辨别 小 样本 规模 对 这 些 结 果 的 影响 。 我 们 怀疑 ， 即 
使 /很 大 ，T 的 似 然 值 在 每 个 m 很 小 时 可 能 会 相当 倾斜 ,因此 会 导致 检验 结果 
不 准确 。Raudenbush 和 Bryk (1985) 曾 建 议 一 种 对 似 然 值 的 绘图 方法 ， 但 是 
在 的 维度 较 多 时 使 用 这 种 方法 就 变 得 很 困难 。 


对 层 -1 随机 系数 的 推断 


第 3 章 曾 讨论 了 对 随机 系数 B, 建立 置信 区 间 和 假设 检验 的 方法 。 我 们 
提 到 ， 对 每 一 单位 分 别 做 OLS 估计 可 能 得 到 精确 的 检验 和 区 间 。 然 而 ， 除 
非 每 一 单位 的 样本 规模 相当 大 ， 否 则 这 些 区 间 会 非常 大 ， 有 关 检 验 会 非常 
保守 。 

另 一 种 方法 是 将 置信 区 间 和 假设 检验 建立 在 经 验 贝 叶 斯 估计 Bp” 的 基础 之 
E, BÈ, 这些 检验 和 区 间 并 不 反映 关于 方差 分 量 的 不 确定 性 。 因 此 ， 除 非 7T 
Ao 得 到 精确 的 确定 ， 否 则 这 种 区 间 会 过 窄 ， 有 关 检 验 会 过 于 散漫 。 

MLR 对 比 MLF。 用 经 验 贝 叶 斯 方法 对 随机 效应 推断 的 准确 性 也 依赖 于 似 
然 方法 的 选择 : MLF 和 MLR。 基 于 MLF 的 推断 要 求 一 个 假定 ， 即 模型 中 的 固 
定 效应 等 于 其 ML 估计 。 因 此 ， 基 于 MLF 计算 的 区 间 将 比 基 于 MLR 的 区 间 罕 
一 些 。 当 J 变 得 很 大 时 ， 这 两 个 区 间 将 会 收敛 到 一 起 。 


中 在 这 种 情况 下 ， 似 然 比 统计 量 的 大 样本 分 布 将 不 是 xin. HP 是 虚无 模型 中 的 参数 数目 ， 
A 是 赫 代 模型 即 较 简单 的 模型 中 的 参数 数目 ， 这 一 统计 量 将 作为 一 种 混合 的 妇 分布 〔 Stram & 
Lee, 1994), Pinheiro 和 Bates (2000) 曾经 做 过 模拟 ， 比 较 了 似 然 比 检 验 与 其 他 的 方法 ， 尝 试 
取得 这 一 统计 散 的 校正 的 大 样本 分 布 ， 他 们 发 现 ， 建 立 这 种 补正 的 混合 体 很 困难 ,建议 仍 使 用 
标准 的 似 然 比 统计 量 ， 因 为 它 容易 应 用 ， 但 同时 要 牢记 它 有 些 保守 。 
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附 R 
对 层 -1 结构 模型 的 错误 设置 


前 面 我 们 讨论 过 层 - 1 模型 的 错误 设置 对 估计 层 - 2 系数 的 影响 。 当 关注 
层 -1 斜率 的 自 变 量 时 ， 我 们 认为 ， 要 是 有 三 种 情况 发 生 ， 效 应 估计 将 会 有 
偏 。 这 三 种 情况 为 : (a) 层 -1 的 省 略 自 变量 必须 与 了 相关 ; (b) 它 必须 与 
层 -1 模型 已 有 的 自 变 量 相关 ; (c) 这 一 省 略 自 变量 与 其 他 已 有 自 变量 的 相关 
必须 在 各 单位 之 间 有 所 变化 ， 并 且 这 种 统计 联系 的 程度 必须 与 层 -2 模型 中 的 
一 个 自 变量 有 关 。 下 面 ， 我 们 来 证 明 这 些 断 言 。 我 们 需要 强调 ， 这 些 条 件 并 不 
WATE -2 截 距 模 型 的 自 变量 。 

设想 真实 的 层 - 1 模型 为 ; 


Y = XIB + XB +r, r~ NO,ol) (9. 32] 


其 中 ，Y 是 结果 向 量 X, 5X, RAMA RRM (有 列 满 秩 ) ，B, MB, 是 未 
知 效应 向 量 ，r 是 误差 向 量 ， 其 中 的 向 量 和 和 矩阵 都 是 可 相 乘 的 。 假 定 Y 变量 在 
每 一 组 都 有 平均 数 为 0 ( 即 层 -1 模型 都 没有 截 距 ) 。 

但 是 ， 假 如 这 一 模型 在 实际 中 被 估计 为 : 


Y = XiB +e [9.33] 
其 中 ，e =X,B; +r， 那 么 ， 对 各 单位 内 部 进行 OLS 回归 ， 有 : 
Ê, = (XIX,) -XTY 
它 有 期 望 : 
E(B,) = B, + (XTX) XIXA, (9. 34] 
这 揭示 出 ， 当 满足 两 个 条 件 时 ， 即 B, 为 非 0， 以 及 回归 系数 矩阵 : 
Ban = (X{X,)'X?x, 


为 非 0 时 , 6, 是 B, 的 有 偏 估计 。 
在 层 -2， 真实 的 模型 为 : 
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B= Wy +u, [9.35] 
B: = Wy +u, [9.36] 


其 中 ，W, AW, 为 自 变量 矩阵 ，y， My, 是 固定 效应 向 量 ，u Mu, 是 随机 误 
差 向 和 量 。 真 正 的 组 合 模型 应 该 写 为 : 
Y =X, Wy, + XWy te [9.37] 
其 中 ，s =X,u,+X,u, +r。 但 是 ， 所 估计 的 模型 却 是 : 
Y= XWy +e" 
其 中 ，e =X,u, +X,8, +r, Xt y, 的 一 般 最 小 二 乘 估计 为 ; 
yı = (WIV' IW,) WV' S, [9.38] 
Kip, Vi Be 的 离散 矩阵 。y, 的 期 望 将 是 : 
E(y,) = y, + (WV OW) WB, Wy, [9.39] 


那么 ， 当 下 列 任何 一 个 条 件 满足 时 ， 这 一 偏差 项 将 是 0: 

1.E(B,) =W,y, =0 (BW, 与 B, 之 间 无 关 ) 。 

2.B,.， =0 ( 即 X, 5X, 之 间 无 关 ) 。 

3. By, FW, LK. DER, (WIV 'W,) WIV" 6, BA RB, 
其 中 B,., BAR, W 是 预测 变量 。] 

所 以 ,具备 上 述 所 列 的 二 个 条 件 时 ， 偏 差 就 会 发 生 。 


层 -1 自 变 量 测 量 有 误 
假如 真实 的 层 - 1 模型 为 : 
Y= XB+r [9.40] 
但 是 ， 所 估计 的 模型 却 是 : 


Y=X,6+r" 


Hep, X,=X+E 为 对 X 的 有 误 测 蕙 ,误差 为 E， 其 期 望 值 为 0。 于 是 ， 其 真 
实 的 模型 可 以 写 为 : 
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Y = XiB+EB+r [9.41] 


于 是 发 现 我 们 已 经 以 一 种 特殊 形式 错误 地 设置 了 模型 (见方 程 9.32 A 9.33), 
定义 了 X,=X,, X,=-E, UKB, =B, =B。 所 以 ， 前 一 部 分 结果 适用 ， 但 是 
条 件 1 即 E(B,) =0 显然 不 适用 。 然 而 ,现在 有 : 


By, =- (XXa) XIE 


Wat TEN X WRX, 的 不 确定 性 程度 。 我 们 以 前 的 结果 意味 着 ， 当 且 仅 当 
(a) 测量 可 靠 性 在 不 同 单位 之 间 变化 ,并且 (b) 这 一 可 靠 性 与 层 -2 自 变量 
SEM W 的 元 素 有 关 时 ,测量 误差 EE 将 是 对 y, 的 有 偏 估计 。 
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分 层 一 般 化 线性 模型 


o 作为 分 层 一 般 化 线性 模型 特例 的 两 层 分 层 线性 模型 
e 对 二 分 类 结果 的 两 层 和 三 层 的 模型 

e 计数 数据 的 分 层 模 型 

© 序 次 数据 的 分 层 模 型 

© 多 项 数据 的 分 层 模 型 . 

© 在 分 层 一 般 化 线性 模型 中 的 估计 工作 考虑 

© 本 章 术语 概要 


在 以 上 章节 描述 的 分 层 线性 模型 (HLM) 只 适用 于 两 层 和 三 层 嵌 套 的 数 
据 ， 其 中 有 两 个 特征 : (a) 各 层 的 期 望 结果 都 能 够 表示 为 回归 系数 的 线性 函 
数 ; (b) 各 层 的 随机 效应 可 以 合理 地 假定 为 正 态 分 布 。 其 线性 假定 可 以 用 标 
准 的 图 示 方 法 ( 见 第 9 章 ) 来 检查 。 在 层 - 1 结果 变量 为 连续 变量 的 情况 下 ， 
其 正 态 假定 也 可 以 相当 广泛 地 应 用 。 甚 至 当 一 个 连续 的 结果 变量 分 布 偏 度 很 大 
时 ， 通 过 转换 往往 也 可 以 至 少 使 层 -1 的 随机 效应 RE) 的 分 布 做 到 大 致 为 
正 态 。 第 9 章 已 经 讨论 了 对 层 -2 和 层 -3 随机 效应 正 态 性 的 检查 方法 。 

然而 ， 在 某 些 重 要 的 场合 中 ， 线 性 假定 和 正 态 假定 都 明显 是 不 现实 的 ， 并 
且 也 无 法 通过 转换 得 到 线性 和 正 态 性 。 二 分 类 结果 就 是 这 种 情况 的 一 个 例子 。 
比如 ， 用 了 表示 是 否 患 某 种 疾病 (Y= 1 标志 有 这 种 病 ，Y =0 标志 没有 这 种 
病 )， 或 表示 是 杏 高 中 毕业 (Y= 1 标志 某 学 生 已 经 按时 毕业 ，Y =0 标志 没有 
按时 毕业 )， 或 表示 是 否 犯罪 (Y = 1 标志 某 人 在 一 定时 段 中 犯 过 罪 ，Y = 0 标 
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志 其 没有 犯罪 ) 。 在 这 些 场合 中 采用 标准 的 层 - 1 模型 将 是 不 适当 的 ， 其 中 有 

1. 在 标准 的 分 层 线性 模型 中 没有 限制 层 -1 结果 的 预测 值 ， 因 此 它们 可 以 
合法 地 取得 任意 实数 值 。 与 此 相反 ， 对 二 分 类 结果 了 Y 的 预测 值 在 作为 Y=1 的 
发 生 概率 来 理解 时 ， 却 必须 处 于 (0, 1) 值 域内 。 这 种 限制 才能 使 模型 定义 
的 效应 规模 有 意义 。 而 对 预测 值 的 非 线 性 转换 ， 比 如 logit 转换 或 probit 转换 ， 
可 以 满足 这 种 限制 条 件 。 

2. 在 给 定 预 测 结 果 值 的 条 件 下 ， 层 -1 随机 效应 只 能 取得 两 个 值 中 的 一 
个 ， 所 以 其 不 可 能 是 正 态 分 布 的 。 

3. 层 ~1 随机 效应 不 可 能 有 同 质 性 的 方差 。 如 下 所 示 ， 这 -- 随 机 效应 的 方 
差 其 实 依赖 于 预测 值 。 

用 标准 分 层 线性 模型 不 能 合理 分 析 的 第 二 个 例子 涉及 计数 数据 ， 比 如 ，Y 
是 某 人 在 一 年 之 中 的 犯罪 次 数 ， 或 者 了 是 一 个 学 生 在 一 堂 课 中 提问 的 次 数 。 在 
这 些 情 况 下 , 了 的 可 能 值 是 非 负 的 整数 0、1、2……。 这 种 数据 是 典型 的 正 偏 
态 分 布 。 如 果 数 据 中 的 0 很 少 ， 其 转换 形式 Y” =log(1 +Y) 或 Y” =V7 都 可 以 
解决 这 一 问题 ， 以 便 合 理 地 应 用 线性 模型 。 但 是 在 某 些 情 况 下 事件 发 生 频数 很 
小 并 存在 大 量 的 0 (比如 ， 在 一 年 中 许多 人 一 次 犯罪 记录 也 没有 ， 在 一 堂 课 中 
许多 学 生 一 次 提问 也 没有 ) ， 这 时 ， 便 不 能 通过 转换 来 近似 取得 正 态 假定 。 基 
于 线性 模型 的 预测 值 可 能 是 负 的 ， 于 是 模型 系数 的 意义 便 不 能 解释 。 此 外 ， 在 
二 分 类 结果 的 情况 下 ， 层 - 1 随机 效应 的 方差 将 依赖 于 预测 值 ( 即 较 大 的 预测 
值 与 较 大 的 残 差 方 差 相连 ) 。 

分 层 一 般 化 线性 模型 (hierarchical generalized linear models， 简 标 为 
HCLMs) ， 也 称 为 一 般 化 线性 混合 模型 (generalized linear mixed models， 参 见 
Breslow & Clayton, 1993) 或 带 随机 效应 的 一 般 化 线性 模型 (generalized linear 
models with random effects, ÆW Schall, 1991) ， 提 供 了 一 种 对 含有 非 线性 结构 
模型 和 非 正 态 分 布 误差 的 分 层 数据 的 分 析 模 型 框架 。 对 于 分 层 线性 模型 和 分 层 
一 般 化 线性 模型 之 间 的 比较 平行 于 “ 单 层 ”的 标准 线性 回归 模型 与 McCullagh 
和 Nelder (1989) 提出 的 一 般 化 线性 模型 之 间 的 比较 。 但 是 ， 在 多 层 数据 的 情 
况 下 还 有 一 些 新 的 问题 产生 。 

在 本 章 中 ， 我 们 将 讨论 一 般 化 线性 模型 如 何 扩展 以 包括 重复 测量 和 多 层 数 
据 。 本 章 包括 几 个 目的 ， 通 过 不 同 的 例子 ， 我 们 将 讨论 ; 
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。 作为 带 有 层 - 1 正 态 抽样 模型 和 恒 等 连接 函数 的 分 层 一 般 化 线性 模型 的 
一 种 特殊 情况 的 分 层 线性 模型 ; 

。 具有 贝 努 里 抽样 模型 和 logit 连接 函数 的 二 分 类 结果 的 模型 ; 

o 两 种 对 计数 数据 的 模型 ， 即 二 项 分 布 抽 样 模型 加 logit 连接 函数 ， 以 及 
泊 松 抽样 模型 加 对 数 连接 函数 ; 

© 序 次 分 类 数据 的 模型 ， 即 多 项 抽样 模型 与 累计 logit 连接 函数 ; 

© 名义 测 度 分 类 数据 的 模型 ， 即 多 项 抽样 模型 与 多 项 logit 连接 函数 。 


我 们 还 将 考虑 在 分 层 一 般 化 线性 模型 中 的 一 些 特殊 问题 : 


。 具体 单位 的 模型 与 总 体 平均 模型 的 对 比 ; 
。 过 离散 (或 从 离散 ) 问题 。 


作为 分 层 一 般 化 线性 模型 特例 的 两 层 分 层 线 性 模型 


分 层 一 般 化 线性 模型 中 的 层 - ! 模型 由 三 个 部 分 组 成 : 一 个 抽样 模型 、 一 
个 连接 函数 、 一 个 结构 模型 。 实 际 上 ， 分 层 线性 模型 可 以 视 为 分 层 一 般 化 线性 
模型 的 一 个 特例 ， 其 中 抽样 模型 是 正 态 的 ， 连 接 函 数 是 恒 等 连接 函数 ， 结 构 模 
型 是 线性 的 。 


层 -1 抽样 模型 


两 层 分 层 线性 模型 的 抽样 模型 可 以 表示 为 : 
Yolu, ~ NID(n oz) [10.1] 


RHEE MM RF, -1 结果 是 独立 的 正 态 分 布 ， 并 且 有 期 户 
值 w, 和 相同 的 方差 o*。 层 -1 期 望 值 和 方差 也 可 以 写 为 ， 


E(Y,|u,) =),  Var(¥,iu,) = o° (10, 2] 


Fe -1 连接 蚁 数 


总 而 言 之 ,为 了 保证 预测 结果 限制 于 给 定 区 间 之 内 而 将 层 - 1 预测 值 y, 进 
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行 转换 是 可 能 的 。 我 们 将 这 种 转换 的 预测 值 标注 为 n;， 这 种 转换 被 称 为 连接 
函数 。 在 正常 情况 下 ， 是 用 不 着 进行 转换 的 。 但 是 ， 用 不 着 转换 的 决策 可 以 用 
以 下 公式 明确 表示 : 

T = Hy (10. 3) 


EXIT, PERRY “TEE RK”, 
Fe -1 结构 模型 
转换 的 预测 值 n; 现 在 通过 线性 结构 模型 与 模型 的 自 变量 相连 接 。 线 性 结 
构 模型 为 ; 
My = Bo + ByXiy + ByXay + + BYX yy {10.4} 


很 清楚 ， 将 层 -1 抽样 模型 (方程 10. 1) 、 层 -1 连接 函数 (方程 10.3) 和 
层 -1 结构 模型 (方程 10.4) 组 合 起 来 ， 便 得 到 了 通常 的 分 层 线性 模型 的 层 - 1 
模型 。 在 分 层 线性 模型 中 ， 当 实际 只 需要 一 个 方程 时 却 要 写 三 个 方程 显得 有 点 轧 
春 ， 但 是 那些 多 余 的 方程 在 更 复杂 的 非 线 性 模型 情况 下 就 变 得 很 有 必要 了 。 


对 二 分 类 结果 的 两 层 和 三 层 的 模型 


尽管 标准 的 分 层 线性 模型 采用 正 态 抽样 模型 和 便 等 连接 函数 ， 二 分 类 结果 
模型 却 采用 二 项 抽样 模型 和 logit 连接 函数 。 


层 -1 抽样 模型 
定义 发 为 my 次 试验 当中 “成 功 ”的 数量 ， 并 定义 g, 为 每 一 次 试验 中 的 成 


功 概率 ， 然 后 我 们 用 


¥,|g, ~ Blm,.@,) 110. 5] 


来 标志 VAAL m, 次 试验 、 每 一 次 试验 的 成 功 概率 为 p, 的 二 项 分 布 。 根据 二 
项 分 布 性 质 ，Y, 的 期 望 值 和 方差 为 ; 
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E(Y jw,) = mif, Var( if) = ml =g) [ 10.6) 


其 中 ， 当 m, =1 it, YW SR AEE, BARE O 或 是 1。 这 种 特殊 情况 被 称 
为 贝 努 时 分布 。 我 们 注意 到 ， 在 某 些 应 用 场合 中 ， 数 据 也 许 并 不 精确 地 服从 这 
种 模型 。 实 际 的 层 -1 方差 可 能 会 大 于 假设 值 ( 即 过 离散 ) ， 也 可 能 会 小 于 假 
i RARO. 。 比 如 ， 当 有 未 发 觉 的 群 组 存在 于 层 - 1 单位 中 , 或 者 层 -1 
模型 设 图 不 当 ， 过 离散 问题 就 会 产生 。 对 于 这 些 情况 ， 有 可 能 将 模型 进行 扒 
广 ， 以 估计 出 标量 方差 分 量 o*， 于 是 层 - 1 FERA o mel - w) 。 我 
们 对 于 高 中 课程 失败 的 分 析 ( 见 后 面 ) 便 是 这 样 的 一 个 例子 。 


层 -1 连接 函数 


当 层 -1 抽样 模型 为 二 项 分 布 时 ， 好 几 种 连接 函数 都 是 可 能 的 (参见 
Hedeker & Gibbons, 1994) ， 但 最 通常 、 最 方便 的 是 logit ERM, B: 





n, = log( 1 2) [10.7] 
FED, ,是 成 功 的 发 生 比 (odds) 的 对 数 。 当 成 功 的 概率 p, =0.5 时 ， 成 功 的 发 
生 比 为 py/A(1 -gp,) =0.5/0.5 =1.0 ， 而 对 数 发 生 比 (log odds)， 或 称 “logit”， 
为 log(1) =0。 当 成 功 的 概率 小 于 0.5 时 ， 发生 比 便 小 于 1.0， 而 相应 的 logit 值 
便 是 负 的 。 当 概率 大 于 0.5 时 ， 发 生 比 便 大 于 1.0， 而 logit 值 是 正 的 。 注 意 ， 尽 
管 pi 被 限制 在 (0, 1) 区 间 之 内 ，logit (A 7, 却 可 以 取 任何 实数 值 。 


B -1 结构 模型 


层 -1 结构 模型 的 形式 与 方程 10. 4 完全 相同 。 注 意 ， 在 方程 10.4 中 ,各 
B 的 估计 在 任意 情况 下 都 能 得 出 预测 的 对 数 发 生 比 (ny) o 这样 一 个 预测 的 对 
数 发 生 比 可 以 通过 exp(my) 转换 回 发 生 比 。 预 测 的 对 数 发 生 比 还 可 以 通过 以 
下 方程 转换 为 预测 概率 : 


[10.8] 


Py = 1 + expl = 7,) 


很 清楚 ， 不 管 n, 取 什么 值 ， 应 用 方程 10. 8 都 能 得 到 一 个 介 于 0 和 1 之 间 的 w, 值 。 
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层 -2 和 层 -3 模型 


在 两 层 分 析 的 情况 下 ， 层 - 2 模型 与 以 前 各 章 中 的 层 ~ 2 模型 有 同样 的 
ÉR: 


Sa 


Be = yo + LW, + uy [10.9] 


其 中 ， 随 机 效应 uy, @=0, =, 0, WMT u 的 一 个 向 量 ， 具 有 多 元 正 态 分 
布 、 各 分 量 的 均值 为 零 、 方 差 协 方差 矩阵 为 T。 在 三 层 分 析 的 情况 下 , 层 -2 
和 层 -3 模型 与 第 8 章 中 所 描述 的 三 层 分 层 线 性 模型 是 相同 的 。 


一 个 贝 努 里 分 布 的 例子 : 泰国 学 生 留 级 研究 

1988 年 在 泰国 进行 的 一 次 小 学 教育 的 全 国 性 调查 提供 了 艇 套 于 356 所 小 
学 中 的 7516 个 六 年 级 学 生 的 信息 ,了 我 们 感 兴趣 的 是 ， 学 生 在 小 学 期 间 留 级 的 
概率 (UR RA HR, REPETITION = 1; 如 果 没 有 则 REPETITION = 0)。 表 
10. 1 提供 了 有 关 描述 性 统计 。 


表 10.1 泰国 数据 的 描述 性 统计 

















= - o A — 1S EIT — 
变量 频数 平均 值 HEE 最 小 值 最 大 值 
SES (社会 经 济 状况 ) 7516 Do 0.68 -1.76 3.48 
MALE (BE) 7516 0.51 0. 50 0 1 
DIALECT (7 #) 7516 9.48 0. 50 0 1 
BREAKFAST (早点 ) 7516 0. 84 0. 36 0 1 
PREPRIM (学 的 前 教育 ) 7516 0. 50 0. 50 0 1 
REPETITION (留级 ) 7516 0.14 0.35 0 1 

7 _ 层 -2 描述 性 统计 四 
变量 eH 平均 值 标准 其 最 小 值 最 大 值 
MEAN SES( 社会 经 济 状况 均值 ) 356 ~0.01 0.44 -0.93 2 
SIZE (学 校规 模 ) 356 0. 00 0.85 -1.77 1.61 
TEXTS (教材 ) 356 0.01 1.85 -5.95 2. 59 


O 这 一 研究 是 密 敬 根 州立 大 学 和 泰国 国家 小 学 教育 委员 会 之 间 的 合作 项 目 ， 并 得 到 美国 国际 发 展 
器 的 支持 。 有 关 详 情 请 参见 Raudenbush 和 Bhumirat {1992) 。 
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共有 6 个 层 -1 变量 。 注 意 ， 大 约 有 14% 的 样本 在 小 学 期 间 至 少 有 过 一 次 留 
级 。 表 中 信息 还 表明 ，51% 的 样本 是 男孩 (如 果 是 男生 ，MALE = 1; 如 果 是 女 
生 ， 则 为 0) 48% 的 学 生 讲 中 部 泰语 (DIALECT =1), 84% 的 学 生 每 天 吃 早点 
(BREAKFAST =1), 50% 的 学 生 曾 经 有 学 龄 前 教育 经 历 (PREPRIM =1)。 社 会 
经 济 状况 (SES) 由 父母 的 职业 声望 、 教 育 程度 和 收入 水 平 构成 。 学 校 层 次 的 变 
FREI: 学 校 的 社会 经 济 状况 均值 (MEAN SES) 、 学 校 的 招生 规模 (SIZE) 、 学 
校 中 的 教材 可 获 性 基 度 (TEXTS), 

无 条 件 模 型 。 为 了 测量 学 校 之 间 在 留级 方面 的 差异 程度 ， 我 们 先 用 无 自 变 
重 的 模型 估计 了 各 层 的 情况 .在 贝 努 里 抽样 模型 和 logit 连接 函数 条 件 下 ， 
层 -1 模型 为 : 


Ny = By (10. 10} 


层 -2 模型 为 : 


Ba, = Yoo + Mays tty ~ NCO, 4.) [10.11] 


这 里 ，yw 是 泰国 小 学 中 留级 的 平均 对 数 发 生 比 ，7w 是 学 校 之 间 在 学 校 平均 留 
级 对 数 发 生 比 上 的 方差 。 估 计 结 果 为 : Yo = - 2.22(se = 0.084), fa = 1.70 
(se = 0.16) 。 于 是 ， 对 于 一 个 “典型 的 ”学 校 ， 即 随机 效应 uy =0 WER, 
期 望 的 留级 对 数 发 生 比 为 - 2. 22， 对 应 的 发 生 比 为 exp( - 2.22) =0.109, 或 
者 说 约 为 1:9， 而 对 应 的 概率 为 1/[1 + exp(2.22) ] =0.097。 

注意 ， 与 学 校 层 次 随机 效应 为 零 相 联系 的 这 一 “典型 的 ”概率 大 大 地 小 
于 就 总 体 而 言 估计 的 留级 率 0.14 ( 见 表 10.1) 。 这 种 差别 是 由 于 在 留级 的 对 数 
发 生 比 和 留级 的 概率 之 间 存 在 着 非 线性 的 关系 。 正 如 图 10.1 所 反映 的 ，”, 的 
95 % 预测 区 间 的 上 限 和 下 限 关 于 其 平均 值 - 2. 22 对 称 。 但 是 ，w, 的 相应 区 间 
却 不 是 关于 其 相应 平均 值 p = 0. 097 对 称 的 。7, 的 正 态 分 布 意味 着 其 平均 值 和 
中 位 数 相 等 ， 都 为 -2.22。 而 与 之 相反 ，g 的 正 偏 态 分 布 却 意味 着 ,总体 平均 
的 概率 将 高 于 其 中 位 数 0.097 (参见 下 一 节 “ 总 体 平均 模型 ”中 的 进一步 讨 
£). 

假设 学 校 的 留级 对 数 发 生 比 近似 于 正 态 分 布 ， 有 平均 值 - 2. 22 和 方差 
Foo =1.70， 我 们 将 期 望 约 95% 的 学 校 的 Bu 值 处 于 - 2.22 + 1.96 x VE70 = 
(-4.78,0.34) 之 间 。 将 这 些 对 数 发 生 比 折算 为 概率 ， 图 10. 1 表明 ， 就 留级 
概率 而 言 ，95% 的 学 校 处 在 (0.008, 0.59) 之 间 。 这 表明 ， 有 些 学 校 的 留级 
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率 几 乎 为 0， 而 在 另外 一 些 学 校 中 ,一 半 以 上 的 学 生 将 在 小 学 期 间 有 留级 
情况 。 | 

在 标准 的 两 层 分 层 线 性 模型 的 框架 中 ， 组 间 相 关 ， 即 层 -2 方差 与 总 变异 
之 间 的 比 ， 是 一 个 有 用 的 指标 但 遗憾 的 是 ， 这 个 指标 在 非 线性 连接 函数 的 情 
况 下 用 处 不 大 , 因为 层 -1 方差 现存 是 异 质 性 的 。 比 如 ,在 贝 努 里 分 布 情况 
F, 层 -1 方差 将 等 于 yg,(1 - w,) ， 其 中 gs, 按照 层 -1 模型 定义 是 预测 概率 。 
在 二 项 分 布 数据 的 情况 下 ,测定 层 -2 变异 幅度 的 更 有 用 的 方法 是 检查 像 图 
10. 1 那样 的 曲线 图 











对 数 发 生 比 


图 10.1 作为 生体 学 校 留级 的 对 数 发 生 比 的 函数 的 具体 学 校 的 留级 概率 
注 : 纵向 的 碰 线 标志 的 是 对 具体 学 校 轩 级 的 对 数 发 生 比 的 5% 预 测 区 间 的 界限 ， 而 横向 的 
瞄 线 标志 的 是 对 基体 学 校 久 级 的 概率 的 95% 预测 区 间 的 界限 (图 中 eta 好 文中 的 nn，phi W p) 


四” 对 二 项 模型 的 男 一 种 替代 概念 来 自用 潜在 变量 Zi yy + 7 的 方式 来 重新 理解 层 - 1 模型 (Sni- 
jders & Bosker, 1999, 第 14 W), RE, n EENE 10, 4 中 的 线性 自 变量 ， 仍 设 诬 -1 随机 效 
应 为 标准 轴 吉 斯 特 分 布 ， 有 平均 值 为 0、 方 差 为 mr/3。 在 这 种 情况 下 ， 组 癌 相关 可 以 计算 为 
P =T (To + /3) 这 种 对 户 的 理解 依赖 于 将 mi 作 为 logit 连接 函数 ， 并 且 假定 潜在 的 1 Mit 
Me RS A. SRR, ARRES, ，m probit EHR MAT. WE a ER RR a a 
ffi (Long, 1997, 9% 3B). 
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条 件 模型 我 们 假设 ， 在 层 - 模型 中 ， 较 低 留级 率 的 影响 因素 为 ; 拥有 
学 龄 前 教育 经 历 、 较 高 的 社会 经 济 状况 、 女 生 、 常 规 教学 语言 即 中 部 泰语 以 及 
每 天 吃 早点 。 我 们 还 假设 ， 在 层 2 中 存在 着 “情景 效应 ” ( 见 第 5 章 )， 比 如 
较 高 的 学 校 社会 经 济 状况 均值 (MEAN SES) 将 导致 较 低 的 留级 率 。 此 外 还 候 
设 ， 较 大 的 学 校 和 能 够 做 到 每 个 学 生 都 有 教科 书 的 学 校 ， 将 有 较 低 的 留 
级 率 ,5 

具体 地 说 ， 层 -1 的 结构 模型 为 ， 


m, = By + B,(SES), + B (MALE), +g, (DIALECT), PUREE 
i [10.12] 


+ B,( BREAKFAST), + 8, (PREPRIM), 
其 中 ， 社 会 经 济 状况 SES 是 按 总 平均 数 对 中 的 ， 所 有 其 他 层 - 1 自 变 量 都 保持 
其 虚拟 变量 测量 。 
在 层 -2 模型 中 将 Bu 作为 层 - 2 自 变 量 的 函数 。 将 其 他 层 -1 系数 B,， 
P>0， 作 为 固定 的 : 


Ba = Yoo + Yo (MEAN SES), + Yo (SIZE), + yo (TEXTS), + ug 
B, = Ya (Mp > 0 时 ) 


首先 考虑 表 10.2 中 (a) 列 的 结果 ”这些 结果 是 在 假定 层 - 1 为 正 态 且 
有 恒 等 连接 函数 ( 即 一 个 标准 的 两 层 模型 ) 时 取得 的 。 从 表面 上 看 ， 这 些 
结果 看 起 来 似乎 合理 。 比 如 ， 截 距 是 0.161。 这 就 是 对 一 个 有 (SES), = 
(MALE), = (DIALECT), = (BREAKFAST), = (PREPRIM), = 0 的 学 生 所 
预测 出 的 留级 概率 ， 即 一 个 不 讲 中 部 泰语 、 处 于 社会 经 济 状况 均值 、 没 有 学 
龄 前 教育 经 历 、 不 是 每 天 吃 早点 并 且 在 一 个 “典型 的 学 校 ”( 即 uy =0) 上 
学 的 女孩 的 留级 概率 。 这 个 模型 说 明 ， 学 龄 前 教育 可 减少 0. 050 的 留级 概 
率 ， 使 其 降 到 0. 161 -0.050 =0. 111。 每 天 吃 早 点 还 可 以 再 减少 0.030， 达 
到 0.111 -0.030 =0.081。 如 果 现 在 再 假设 其 学 校 的 社会 经 济 状况 均值 高 于 
平均 水 平一 个 单位 ， 那 么 期 望 留级 概率 还 会 再 减少 0.064， 达 到 0. 017。 于 
是 ， 这 里 出 现 了 一 个 麻烦 : 当 MEAN SES 再 有 一 个 单位 的 增加 时 将 导致 期 望 
留级 概率 变 成 负 值 ! 


(10. 13] 


O ERR, KER EER TE SOM, HAREM Te Rw TM. 
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表 10.2 根据 三 种 模型 对 层 -2 系数 的 估计 
(b) Logit 连接 : 。 (ce) Logit 连接 : 





国定 效应 (a) 恒 等 连接 具体 单位 模型 总 体 平均 模型 
R — RE. Yoo oaa “2, 175% -1734 * 
MEANSES, yo ~-0.064" -0.691° -0.018 
SIZE. yor -0.017 -0.232 -0.193 
TEXTS, Yo 0. 000 0.016 -0.001 
SES 4%. py ME. yio -0.0234 -0.363% -0.319 °" 
MALE HE, Ay RE. yu 0.056 *** 0. 562 °** 0.476 *** 
DIALECT #1, 8s, RE. y» 0.025 0. 309 * 0.2 
BREAKFAST #1, 8, RE. yu ~ 0.030" ~0, 347°" ~0. 295°" 
PREPRIM 斜率 ，B， ME, yo 0. oso 一 0.492 -0.431 * 


ÌE: * 表示 p >2.00。 
** 表示 p >2. 50。 
sse 表示 p >3.00。 


这 一 结果 显示 出 将 概率 理解 为 协 变量 的 线性 函数 的 困难 。 由 于 预测 概率 
会 逐步 减少 到 0， 可 以 期 望 有 利 协 变量 值 的 进一步 增加 会 导致 边际 收益 递减 
(diminish) 。 比 如 ， 人 均 了 美元 的 投入 干预 会 使 留级 率 从 0.10 降 到 0.05, 
但 是 很 难 相 信 投 入 27 美元 便 会 使 留级 率 进 一 步 降 到 0， 更 不 能 想像 更 多 投 
人 还 会 导致 留级 率 变 为 负 值 。 于 是 从 逻辑 上 ， 我 们 需要 用 非 线 性 模型 来 表达 
概率 量度 。 

表 10.2 的 (b) 列 提供 了 logit 连接 函数 的 结果 。 这 里 我 们 看 到 ， 在 模型 
中 其 他 自 变量 和 随机 效应 uo 都 不 变 的 条 件 下 ， 有 学 龄 前 教育 经 历 导致 较 低 的 留 
级 对 数 发 生 比 Fy. = - 0.492 ，! = -4.78。 有 学 龄 前 教育 经 历 的 学 生 期 望 留级 发 
生 比 是 在 其 他 方面 类 似 但 无 学 龄 前 教育 的 学 生 的 留级 发 生 比 的 exp( -0.492) = 
0.611 倍 。 在 其 他 情况 不 变 时 ， 较 高 社会 经 济 状况 SES 的 学 生 有 较 低 的 留级 水 
F Fa = -0.363 ， 即 SES 一 个 单位 的 增加 会 导致 留级 对 数 发 生 比 减少 0. 363， 
与 此 相连 的 相对 发 生 比 (relative odds) 为 exp( -0.363) =0.696。 这 说 明 ， 如 
果 我 们 比较 两 个 学 生 ， 他 们 在 其 他 方面 一 样 但 在 SES 方面 差 一 个 单位 ， 可 以 期 
望 较 高 SES 学 生 的 留级 发 生 比 是 较 低 SES 学 生 的 留级 发 生 比 的 0.696 倍 。 但 
是 ,“ 一 个 SES 单位 ”的 含义 是 什么 ? 从 表 10. 1 中 我 们 看 到 ，SES 的 标准 差 等 
于 0.68。 因 此 我 们 可 以 说 ， 在 SES 上 一 个 标准 差 的 差别 导致 的 留级 对 数 发 生 
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比 变化 0.68 x ( -0.363) = -0.247， 或 者 说 相对 发 生 比 为 exp( -0.247) = 
0.781。 同 理 ， 表 10. 2 说 明 ， 男 生 有 较 高 的 相对 发 生 比 ，exp(0. 562) =1.754。 
每 天 吃 早 点 与 较 低 的 留级 对 数 发 生 比 相连 ， 相 对 发 生 比 为 exp( -0.347) = 
0.707。 令 人 惊讶 的 是 ， 讲 中 部 泰语 却 有 较 高 的 留级 发 生 比 ， 相 对 发 生 比 等 于 
1.362。 在 层 -2， 留 级 的 对 数 发 生 比 与 教科 书 可 获 性 和 学 校规 模 无 关 ， 但 是 在 
其 他 自 变 量 不 变 的 条 件 下 与 学 校 的 MEAN SES fh HK, y,, =- 0.691, t= 
-2.09。 即 如 果 两 个 学 校 其 他 方面 类 似 但 在 MEAN SES 上 相差 一 个 标准 差 时 
( 见 表 10. 1)， 其 在 留级 的 对 数 发 生 比 上 会 有 0.44 x( -0.691) = -0.304 个 单 
位 的 差别 ， 其 相对 发 生 比 为 exp( -0. 311) =0. 738。 

但 是 如 何 将 这 些 结果 再 翻译 为 预测 概率 呢 ? 对比 前 面 描述 过 的 基于 恒 
等 连接 函数 的 结果 (a 列 )， 让 我 们 再 考虑 一 个 不 讲 中 部 泰语 、 不 是 每 天 
吃 早点 、 无 学 龄 前 教育 的 女生 的 情况 。 如 果 这 个 学 生 处 于 SES 平均 值 上 ， 
并 在 一 个 典型 的 学 校 上 学 ,那么 她 的 预测 留级 对 数 发 生 比 将 为 - 2. 175， 
相应 的 概率 为 1/[f1 + exp(2.175)] =0.102。 在 MEAN SES 上 一 个 单位 的 增 量 
将 导致 预测 对 数 发 生 比 为 -2.175 -0.691 = -2.866， 而 相应 的 预测 概率 为 
0.054。 如 果 在 MEAN SES 上 再 增加 一 个 单位 的 量 ， 将 导致 预测 的 对 数 发 生 比 为 
-2.175+2x( -0.691)， 而 相应 的 预测 概率 为 0.029。 按 照 逻辑 要 求 ，MEAN 
SES 上 不 断 的 增加 导致 期 望 概率 缩减 量 不 断 递减 ， 这 种 性 质 是 线性 模型 所 不 具 
备 的 。 


总 体 平均 模型 


在 继续 介绍 其 他 分 层 一 般 化 线性 模型 之 前 ， 我 们 需要 再 简要 考虑 一 下 在 有 
非 线 性 连接 函数 的 模型 中 总 体 平均 ( population-average) 与 具体 单位 (unit- 
specific) 之 间 的 区 别 。 尽 管 基于 这 两 种 模型 的 结论 经 常 相 当 近似 ， 但 这 两 种 
模型 的 指向 却 是 针对 着 不 同 的 研究 目的 。 

无 条 件 模型 。 在 无 条 件 模 型 中 ， 我 们 注意 到 ， 对 于 一 个 处 于 中 位 的 学 校 
( 即 该 学 校 的 uw =0) ， 其 留级 概率 并 不 是 总 体 平均 的 概率 。 一 个 有 随机 效应 为 
0 的 学 校 实际 上 处 于 随机 效应 分 布 的 中 心 。 由 于 层 - 2 随机 效应 被 假定 为 正 态 
分 布 ， 因 此 其 平均 值 等 于 中 位 数 。 但 是 ， 相 应 的 概率 分 布 却 是 正 偏 态 的 ， 因 此 
其 平均 值 大 于 中 位 数 。 

图 10. 1 已 经 揭示 了 这 种 情况 。 该 图 显示 了 作为 对 数 发 生 比 ny (BER) 的 
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所 数 的 概率 o, (AW). XF Bu 的 估计 分 布 画 在 横 轴 之 下 。 它 是 一 个 单 峰 的 
对 称 分 布 ， 其 中 心 为 yw = -2. 22， 标 准 差 为 Vi =1.30。 相 应 的 概率 分 布 画 在 
纵 轴 的 左边 。 对 数 发 生 比 的 中 位 数 对 应 着 中 位 概率 1/[1 + exp(2.22) ] =0.097， 
但 是 ,概率 平均 数 肯定 超过 概率 中 位 数 。 这 个 平均 数 其 实 是 所 有 学 校 j 取得 的 
I/{1 + expl- (Yo + Uy) J] = 1/[1 + exp( - 2.22 - wo)] 的 平均 数 。 
可 以 通过 2 阶 的 马克 劳 林 级 数 展开 式 来 近似 计算 总 体 平均 概率 : 
p= eam) = 和 


+ e "y 


[10.14] 
= ¢,(0) + up, (0) + AO 


其 中 ， 


— 
1 + em 
95(0) = pu(0)[L - ¢,(0)] 
9°(0) = p (0)[1 ~ 2¢,(0)] 


¥.(0) = 


我 们 现在 对 uy, ~ N(O,7) 计算 期 望 值 ， 得 到 : 
E(g,) = ps(0) + rmg4(0)[0.5 - pi(0)] [10.15] 


这 一 对 比 揭示 出 ， 当 wi(0) = 0.5 R To = 0 时 ,平均 概率 E(y,) 将 等 于 
i(0) 。 当 ps(0) < 0.50 对 ， 总 体 平 均 E(w,) 将 会 向 0. 50 方向 被 “ 拉 ” 高 ; 
当 wi(0) > 0.50 时, E(p,) 将 会 问 0.50 方向 被 “ 拉 ” 低 。 在 各 自 的 情况 下 ， 
当 rm 很 大 和 ws(0) PE O. 50 很 远 时 ， 这 一 差距 幅度 将 变 得 非常 大 。 

在 我 们 的 例子 中 ， 根 据 方程 10. 14， 可 以 知道 总 体 平均 p, 要 大 于 0.097。 
具体 来 说 ， 


E(g,) = 9i(0) + 7mg,"(0)[0.5 - 8,(0)] 
= 0,097 + 1.70 x 0.097 x (1 -0.097) x (0.5 - 0.097) (10. 16] 
= 0. 157 
作为 一 种 替代 方法 ， 也 可 以 直接 估计 一 个 总 体 平均 模型 。 在 无 条 件 的 情况 
下 ， 模 型 为 : 


Y,=—1— +e [10. 17] 
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在 这 个 模型 中 ， 层 -2 的 随机 效应 被 吸收 到 e, 中 ， 而 没有 显示 在 分 母 指 数 中 。 
我 们 标注 ymw， 加 上 星 号 标志 是 为 了 区 分 这 一 总 体 平均 截 距 与 基于 方程 
10. 11 得 到 的 具体 单位 估计 yw。 相 应 地 ， 


E(¥,) = El( ew)" ai [ 10. 18] 





我 们 假定 模型 的 残 差 % 在 各 学 校内 的 个 人 之 间 相 关 。 残 差 的 协 方差 矩阵 能 够 由 
我 们 以 前 得 到 的 结果 推导 出 来 (Zeger, Liang, & Albert，1988)。 我 们 对 泰国 数 
据 估计 出 Yoo = -1.73，se =0.069。 在 此 基础 上 估计 的 总 体 平均 概率 为 : 


E(Y,) ~ 1/[1 + exp(1.73)] = 0.151 [10.19] 


这 一 结果 很 接近 于 我 们 用 马克 劳 林 级 数 得 到 的 近似 值 0. 157。 然 而 ， 基 于 方程 
10. 19 得 到 的 估计 其 实 更 为 准确 。 

条 件 模型 。 表 10. 2 (b) 栏 的 系数 可 以 解释 为 ， 在 保持 其 他 自 变量 不 变 和 
保持 随机 效应 uw 值 不 变 的 条 件 下 ， 与 (a) 栏 自 变量 的 单位 增 量 想 联系 的 留级 
对 数 发 生 比 上 的 期 望 差异 。 我 们 称 其 为 “具体 单位 ”估计 ， 在 本 例 中 ， 便 是 
“具体 学 校 ” 的 估计 (这 一 术语 的 来 源 参见 Zeger, Liang, & Albert, 1988), 与 
此 相对 ，(e) 栏 显示 了 “总 体 平均 估计 "。 这 一 栏 提供 了 在 保持 其 他 自 变量 不 
变 条 件 下 的 、 与 各 自 变 量 的 单位 增 量 相 联 系 的 留级 对 数 发 生 比 上 的 期 望 差异 ， 
但 是 它 经 过 了 对 层 -2 随机 效应 分 布 的 平均 。 我 们 注意 到 ， 两 个 模型 之 间 所 有 
结论 的 方向 是 相同 的 ， 统 计 显 著 水 平 也 几乎 是 相同 的 。 但 是 ， 正 如 我 们 根据 近 
似 公 式 所 期 望 的 那样 ， 与 具体 单位 系数 相 比 ， 总 体 平 均 系数 总 是 向 0“ 收 缩 "。 

稳健 标准 误 。 对 具体 单位 模型 和 总 体 平 均 模 型 都 可 以 计算 稳健 标准 误 ， 并 
且 吓 可 以 为 线性 连接 函数 ( 见 第 9 章 ) 也 可 以 为 非 线 性 连接 函数 计算 稳健 标 
准 误 。 我 们 建议 对 基于 模型 的 标准 误 和 稳健 标准 误 进 行 比较 。 它 们 之 间 的 相似 
并 不 能 保证 对 随机 效应 分 布 的 假定 都 是 正确 的 ， 但 是 它们 的 相似 却 的 确 意味 
着 ， 关 于 回归 系数 估计 的 精度 推断 对 数据 与 这 些 假 定 条 件 之 间 的 差距 并 不 敏 
感 。 发 现 基于 模型 的 标准 误 与 稳健 标准 误 之 间 存 在 重要 差别 便 提 供 了 一 种 证 
据 ， 表 明 关于 随机 效应 分 布 的 设置 存在 错误 ， 这 种 错误 设置 会 对 回归 系数 的 扒 
断 造 成 差别 。 在 本 例 中 ， 模 型 计算 的 标准 误 和 稳健 标准 误 对 回归 系数 ( 即 各 
y`) 的 推断 都 很 相似 。 

对 总 体 平 均 模型 和 具体 单位 模型 的 选择 。 具 体 单位 模型 ( 即 分 层 的 结构 
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模型 ) 描述 了 发 生 于 层 -2 各 单位 中 的 过 程 。 这 一 过 程 是 由 层 -1 模型 所 把 握 
的 ,尤其 是 由 层 -1 系数 (各 有 B) 反映 。 研 究 人 员 的 主要 兴趣 在 于 这 些 过 程 在 
层 -2 单位 的 总 体 之 间 如 何 变 化 。 在 某 些 情况 下 ， 如 泰国 的 例子 ， 差 别 主要 在 
于 礁 中 ,但 是 在 本 书 描述 的 其 他 一 些 研究 中 ， 这 种 过 程 却 有 多 方面 的 差别 。 模 
型 描述 了 层 -2 解释 变量 上 的 差别 是 如 何 与 各 层 - 1 单位 中 的 层 - 1 过 程 的 差 
别 相 联系 的 。 这 一 类 的 问题 就 是 内 在 的 “具体 单位 ”问题 (参见 Raudenbush, 
2000) 。 

与 此 相反 ， 总 体 平均 模型 回答 的 是 总 体 平均 方面 的 问题 。 如 果 我 们 用 回归 
模型 来 模拟 学 龄 前 经 历 差别 如 何 与 留级 风险 相 联系 (保持 所 在 学 校 不 变 ) ， 我 
们 便 是 在 问 一 个 具体 单位 的 问题 。 如 果 我 们 想 要 知道 的 是 ， 从 全 国 的 角度 来 
说 ,留级 风险 如 何在 有 或 没有 学 龄 前 经 历 的 学 生 之 间 变 化 (不 用 保持 所 在 学 
校 不 变 ) ， 那 我 们 要 做 的 就 是 总 体 平均 估计 。 

如 果 具 体 单位 模型 是 正确 的 ， 可 以 提供 所 有 层 -2 单位 的 结果 的 整个 分 
布 ， 总 体 平均 结果 可 以 作为 具体 单位 结果 分 布 的 一 个 特征 推导 出 来 。 与 此 相 
反 ， 总 体 平均 估计 不 能 提供 所 有 层 -2 单位 的 结果 分 布 信 息 ， 而 只 能 提供 平均 
值 。 但 是 ， 总 体 平均 推断 只 需要 较 少 的 假定 条 件 ， 并 且 在 模型 随机 效应 的 假定 
有 误 时 也 相当 稳健 (Heagarty & Zeger, 2000), 与 此 相反 ,具体 单位 的 推断 对 
随机 效应 分 布 假定 条 件 的 依赖 性 更 大 。 所 以 , 虽然 具体 单位 模型 更 为 丰富 ， 但 
是 其 代价 是 对 模型 假定 条 件 更 为 敏感 。? 

本 章 采用 非 线性 连接 函数 ， 考 虑 的 所 有 模型 都 要 涉及 具体 单位 推断 与 总 体 
平均 推断 之 间 的 区 别 。 


一 个 二 项 分 布 的 例子 : 九 年 级 第 一 学 期 的 课程 失败 


这 个 例子 的 数据 描述 了 在 1997 ~ 1998 学 年 中 66 所 芝加哥 公立 高 中 的 
19569 名 九 年 级 学 生 的 情况 。 要 研究 的 结果 变量 是 学 生 在 第 一 学 期 课程 失败 的 
数量 。 表 10. 3 提供 了 这 些 数据 的 描述 性 统计 指标 。 在 秋季 学 期 中 ， 九 年 级 学 
生 一 般 要 修 4 门 课程 (CRSTAKEN ) ， 平均 而 言 ，4 门 课 中 有 1 门 不 能 通过 
(比如 失败 课程 CRSFALL 的 总 平均 值 为 0. 94)。 学 生 中 修 课 最 多 的 达到 10 门 


D Heagany 和 Zeger (2000) 发 展 了 对 总 体 平均 回归 系数 的 最 大 似 然 估 计 。 他 们 的 模型 也 提供 了 
具体 单位 估计 。 
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课 ， 而 失败 课程 数 的 最 大 值 为 6 门 - 在 二 项 模型 的 情景 中 ,结果 变量 ;现在 
是 课程 失败 的 数量 ， 而 m, 为 修 课 数量 。 我 们 假定 在 学 校 中 每 个 学 生 i 对 任意 
给 定 课程 的 失败 概率 为 pv。 

层 -1 自 变量 包括 : 八 年 级 结束 时 的 阅读 成 绩 (READ97， 由 分 项 反应 模 
型 定义 的 量度 ) 的 标准 化 测量 分 ， 以 及 其 他 三 个 虚拟 变量 ， 分 别 表示 性 别 (FE- 
MALE) 、 种 族 (BLACK, 、HISPANIC) 。 样 本 中 有 51% 的 女生 、56% 的 非洲 裔 学 
生 、30% 的 西班牙 裔 学 生 。 层 -2 自 变量 有 4 个 : 该 校 以 往 平 均 成 绩 水 平 
(AVEACH， 是 某 一 特定 测验 的 量度 ) ， 以 及 用 于 反映 该 校 学 生 种 族 构成 的 三 个 虚 
拟 变量 (INTEGRT 表示 有 30% 以 上 的 白人 学 生 、PRBLACK 表示 有 85% 以 上 的 
JEON AEE | PRHISP 表示 有 85% 以 上 的 西班牙 育 学 生 )。 在 1997 ~ 1998 学 年 中 ， 
芝加哥 公立 高 中 当中 有 18% 为 整合 学 校 d，47% 主要 是 非洲 裔 学 生 ，9% 主要 是 
西班牙 裔 学 生 ， 剩 下 的 26% 是 种 族 混合 的 学 校 但 白人 学 生 比 例 较 小 。 


表 10.3 课程 失败 数据 的 描述 性 统计 

















层 -1 WE PERT 
= 最 频数 平均 值 标准 差 最 小 值 最 大 值 
CRSTAKEN 19569 4.06 0.64 1.00 10.00 
CRSFAIL 19569 0.94 1.34 0. 00 6. 00 
READ97 19569 1,17 0.98 -3,28 5.98 
FEMALE 19569 0.51 0.50 0.00 1.00 
BLACK 19569 0.56 0.50 0.00 1.00 
HISPANIC 19569 0.30 0. 46 0.00 1.00 
= 2 ate mei 
变 E RH 平均 值 标准 差 最 小 值 最 大 值 
INTEGRT — 0.18 0.39 0.00 Lo 
PRBLACK 66 0.47 0.50 0.00 1.00 
PRHISP 66 0.09 0.29 0.00 1.00 
AVEACH 66 168. 55 40.43 101. 50 329. 00 


无 条 件 模型 。 连 接 函 数 仍然 是 logit 连接 。 为 了 测量 高 中 学 校 之 间 在 课程 
失败 方面 上 的 差异 程度 ， 我 们 估计 了 一 个 完全 无 条 件 模型 (方程 10.10 和 
10. 11)。 在 贝 努 里 情况 下 ，yom 是 芝加哥 公立 高 中 的 课程 失败 的 平均 对 数 发 生 
比 。 从 表 10. 4 可 以 看 到 ， 具 体 单位 估计 为 yw = -1.200。 这 意味 着 ， 就 一 个 


DO 译注 : 兼 收 黑人 学 生 和 白人 学 生 的 学 校 。 
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有 随机 效应 ww =O 的 学 校 来 说 ， 其 学 生存 任意 随机 选择 的 课程 上 失败 的 期 望 发 
生 比 为 exp(- 上 200) =0.30。 就 整个 体系 而 言 ， 基 于 总 体 平均 模型 的 课程 失败 
发 生 比 仅仅 提高 了 一 点 ， 为 exp(-1.140) =0.32。 总 的 来 说 ， 在 这 种 事件 概率 
婚 不 太 低 也 不 太 高 的 情况 下 ， 即 0.80 > yp; > 0.20， 总 体 平均 模型 和 具体 单位 
模型 会 得 到 近似 的 结果 ， 特 别 是 在 rm 很 小 时 更 是 这 样 。 

无 条 件 模型 还 提供 了 学 校 之 间 在 课程 失败 率 上 变异 情况 的 宝贵 信息 。 在 给 
定 估计 为 rm =0. 255 的 情况 下 ， 我 们 可 以 期 望 有 95% 的 学 校 的 课程 失败 的 对 
数 发 生 比 处 于 - 2. 190 和 - 0.210 之 间 。 这 分 别 相当 于 相对 发 生 比 为 0.11 和 
0. 81。 将 对 数 发 生 比 换算 为 概率 p,， 说 明 芝加哥 学 校 的 课程 失败 率 处 于 低 端 
的 0. 10 到 高 端的 0. 45 之 间 。 最 后 ， 我 们 需要 将 其 所 修 课程 数 m, 乘 以 8;,， 以 
预测 任意 一 个 在 学 校 j 的 学 生 i 未 通过 的 课程 数 。 

这 个 模型 还 提供 了 层 -1 过 离散 的 迹象 。 所 估计 的 过 离散 标量 方差 分 量 为 0* = 
2. 294。 如 果 这 个 二 项 抽样 模型 是 正确 的 ， 那 么 我 们 本 应 得 到 一 个 近似 于 1.0 的 值 。 
这 一 差别 不 太 可 能 仅仅 是 出 于 偶然 ， 因 为 在 这 个 分 析 中 o* 的 估计 标准 误 为 0.02。 

有 层 -1 自 变 量 的 模型 。 下 一 步 分 析 是 考虑 各 种 学 生 层次 特征 对 课程 失败 
的 对 数 发 生 比 的 效应 。 具 体 地 说 ， 在 层 -1, 我 们 有 : 


M, = By +B,,( READ), + B,,( FEMALE), +8, (BLACK), + B,( HISPANIC), 
在 层 -2， 我 们 先 将 截 距 作为 随机 的 ， 仍 将 B 系数 作为 固定 的 ， 于 是 有 : 


By = Yoo + uo, 


By = Yal“ p > 0m) 


表 10. 4 的 第 二 部 分 显示 了 这 些 结果 。 在 模型 中 其 他 自 变 量 和 随机 效应 u。 
不 变 时 ， 八 年 级 的 阅读 成 绩 与 课程 失败 的 对 数 发 生 比 成 负 相 关 ，7yiw = 
-0.255。 女 生 课 程 失 败 的 对 数 发 生 比 也 较 低 ，y = -0.450， 但 是 黑人 和 西 
班 牙 裔 学 生 却 较 高 ， 分 别 为 yw =0.317 M yy =0.167。 以 前 ， 阅 读 成 绩 上 一 个 
标准 差 的 增加 将 会 导致 任意 课程 失败 的 发 生 比 降低 为 exp( -0.255 x0.98) = 
0.78 倍 。 同 理 ， 如 果 是 女生 便 可 以 将 这 一 发 生 比 降低 为 exp( - 0.450) =0. 64 
信 。 甚 至 在 控制 了 以 往 成 绩 、 性 别 和 具体 学 校 的 效应 ww 以后， 黑人 和 西班牙 
痪 学 生 课 程 失败 的 相对 发 生 比 也 较 高 ， 其 倍数 分 别 为 1.37 和 1.18 倍 。 

这 一 分 析 中 还 有 一 点 很 显著 ， 对 ye 和 7 所 估计 的 模型 标准 误 和 稳健 标准 
误 相差 很 大 。 这 说 明 ， 随 机 截 距 模型 低估 了 实际 数据 中 存在 的 变异 。 由 于 这 些 
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效应 只 表现 在 两 个 固定 效应 的 估计 上 ， 说明 应 该 将 这 两 个 层 -1 系数 从 固定 的 
改 设 为 随机 的 ， 于 是 层 -2 PRUE EE A: 


By = yo+u( 当 pp=0,1,3 时 ) 
B, = yn (4p = 2,4 it) 


表 10.4 的 第 三 部 分 提供 了 这 一 模型 的 结果 。 学 校 之 间 在 以 往 成 绩 和 黑人 
学 生效 应 上 确实 有 很 大 的 变异 。 两 者 的 估计 方差 分 量 7 和 Ta 的 好 统计 检验 都 
上 分 显著 。 此 外 ， 它 们 各 自 的 95% 的 可 信 值 区 间 (plausible value ranges) 也 相 
当 宽 。 对 于 以 往 成 绩 而 言 ， 课 程 失败 的 对 数 发 生 比 的 可 能 值 域 为 -0.6 ~0.1; 
而 对 于 黑人 学 生 在 课程 失败 上 的 差距 而 言 ， 这 一 可 能 值 域 则 为 -0.4 ~0.9。 在 
许多 学 校 中 ， 作 为 黑人 和 以 往 成 绩 差 都 会 增加 课程 失败 的 对 数 发 生 比 。 但 是 也 
有 少数 几 个 学 校 却 反映 出 相反 的 情况 ( 即 课程 失败 的 对 数 发 生 比 反而 与 以 往 
成 绩 成 正 相关 ， 而 与 黑人 效应 成 负 相 关 ) 。 我 们 还 注意 到 ， 稳 健 标准 误 与 模型 
标准 误 已 经 更 加 近似 ， 这 进一步 肯定 了 这 个 模型 能 更 好 地 拟 合 数据 。 

加 入 层 -2 自 变 量 。 下 一 步 分 析 是 考虑 可 能 的 学 校 情景 效应 对 课程 失败 率 的 
影响 ， 将 这 一 结果 作为 学 校 种 族 构成 变量 (INTEGRT, PRBLACK, PRHISP) 和 
学 校 平 均 成 绩 水 平 (AVEACH) 的 函数 。 我 们 分 析 了 这 些 可 能 效应 的 影响 ， 包 
括 对 学 校 课程 失败 的 调整 对 数 发 生 比 的 影响 Bu ， 以 及 以 往 成 绩 和 学 生 种 族 的 差 
别 影 响 ， 即 B,，p =1，…，4。 我 们 没有 发 现 种 族 构 成 对 层 -2 各 结果 有 什么 影 
H, RERE By 上 的 学 业 成 绩 情景 效应 。 表 10.4 的 最 后 一 部 分 提供 了 最 终 的 最 
佳 拟 合 模型 。 学 校 的 以 往 平均 成 绩 对 课程 失败 的 对 数 发 生 比 有 很 强 的 作用 ，%， = 
-0.009， 这 并 不 令 人 感到 意外 。 这 说 明 ， 当 所 有 其 他 自 变量 和 学 校 随机 效应 u, 
了 =0，1，3， 都 不 变 的 情况 下 ，AVEACH 变量 上 1 个 标准 差 的 增加 (BD 40.43 分 ) ， 
课程 失败 的 对 数 发 生 比 将 减少 0. 36， 与 此 对 应 ， 相 对 发 生 比 上 降低 为 0.70 倍 。 

注意 在 AVEACH 被 纳入 模型 之 后 ， 截 距 方差 7im 从 0.279 减少 为 0. 129。 
调整 的 学 校 课程 失败 的 对 数 发 生 比方 差 中 有 50% 以 上 都 被 学 校 以 往 的 平均 成 
续 水平 解 释 了 。 尽 管 如 此 ， 仍 然 存在 着 很 大 的 学 校 之 间 的 变异 尚未 得 到 解释 ， 
这 一 方面 表现 在 学 校 的 平均 课程 失败 率 上 ， 另 一 方面 表现 在 以 往 成 绩 和 种 族 方 
面 的 差别 效应 上 。 也 就 是 说 ， 还 需要 考虑 学 校 之 间 可 能 存在 的 内 部 结构 和 政策 
上 的 差别 ， 比 如 ， 存 在 的 惯例 、 咨 询 项 目的 强度 等 等 ， 它 们 也 许可 以 再 解释 其 
中 的 一 部 分 。 

类 似 地 ， 层 -1 也 存在 着 很 大 的 过 离散 情况 。 二 项 模型 假定 任意 一 个 在 学 
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校 j 的 学 生 i 的 各 次 反应 ( 即 该 掌 生 所 选 的 不 同 课程 ) 之 间 独 立 ， 只 依赖 于 
8s， 由 于 课程 失败 与 学 生 旷 课 有 关 ， 这 可 以 在 数据 中 引入 群 组 效应 。 也 就 是 
说 ， 一 个 学 生 要 是 经 常 逃学 ， 便 会 在 多 门 课程 上 失败 。 于 是 ， 我 们 还 应 该 在 以 
后 的 分 析 中 将 旷课 测量 纳入 层 -1 模型 。 要 是 我 们 的 推论 正确 ,那么 层 -1 的 
过 离散 将 会 减少 


对 计数 数据 的 分 层 模 型 


分 析 计 数 数据 的 标准 的 一 般 化 线性 模型 采用 泊 松 抽样 模型 和 对 数 连接 于 
数 ， 这 些 都 可 以 直接 扩展 到 分 层 模型 中 来 。 


层 -1 抽样 模型 


令 了 ,为 鞭 一 时 间 间 隔 长 度 m, 中 事件 发 生 的 数量 。 比 如 ， 7 可 以 是 在 小 区 j 
中 的 个 人 i 在 5 年 中 的 犯罪 次 数 ， 因 此 m, =5。 时 间 间 踊 mi 也 称 为 “暴露 期 ” 
(exposure), FERNS H: 


F,lA; ~ P(m,,a,) [10. 20] 


来 标注 心服 从 暴露 期 为 m, 的 泊 松 (Poisson) 分 布 ， 并 且 每 时 间 段 的 事件 发 生 率 为 
Ayo 根据 泊 松 分 布 ， 在 给 定 事 件 发 生 率 A, 的 条 件 下 ，Y, 的 期 望 值 和 方差 分 别 为 : 


E(Y,|A,) = mAy,  Var(Y,[A;) = mà; {10.21] 


用 诸 言 表达 为 ， 对 处 于 组 /的 单位 i 的 事件 数 7, 的 期 望 值 等 于 其 事件 发 生 率 A， 
乘 以 其 暴露 期 m; 而 其 方差 就 等 于 其 平均 值 。 暴 露 期 m, 用 不 着 一 定 是 时 间 量 
度 。 上 比如 ， 在 经 典 的 泊 松 模型 应 用 中 ，7, 是 一 次 战争 中 城市 j 的 街区 i 中 落下 
的 炸弹 数 ， 而 m, 是 那 一 街区 的 面积 。 当 对 于 每 个 i 和 j 都 有 同样 的 暴露 时 便 产 
生 了 一 种 共同 的 情况 ( 比如 当 了 ,是 每 个 小 区 j 的 每 个 人 i 在 一 年 中 的 犯罪 次 数 
时 )。 在 这 种 情况 下 ， 为 了 简单 起 见 ， 我 们 设 my = 1。 根 据 我 们 的 层 -1 模型 ， 
当 m = 工时 ， 为 的 预测 值 便 是 发 生 率 A,。 


层 -1 连接 函数 


当 层 -1 抽样 模型 是 泊 松 分 布 时 ， 标 准 的 连接 函数 是 对 数 连 接 ， 即 ， 
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n, = log(a,) [ 10. 22] 


WIR Ra, ROR AOR. PE, REAR A, 是 1 时 ， 其 对 数 是 0; 
当 发 生 率 小 于 1 时 ， 其 对 数 为 负数 ; 当 发 生 率 大 于 1 时 ， 其 对 数 是 正 数 。 所 
DL, 尽管 ,被 限制 为 非 负 ，log(A,) 却 可 以 取 任何 实数 值 。 


层 -1 结构 模型 


层 -1 结构 模型 与 方程 10. 4 的 形式 完全 相同 。 注 意 ， 方 程 10.4 He BK 
数 的 估计 使 之 可 能 预测 任意 情况 下 的 对 数 发 生 率 加。 这 种 预测 的 对 数 发 生 率 
能 够 转换 为 发 生 率 ， 计 算 公式 为 A，= expla! 。 很 清楚 ， 不 管 六 是 什么 ， A, 
的 值 都 为 非 负 。 


层 -2 模型 


层 -2 模型 的 形式 与 二 项 抽样 和 正 态 抽样 情况 下 的 层 - 2 模型 形式 相同 
(比如 方程 10.9) 。 


WF, 芝加哥 社区 的 杀人 犯罪 率 


Sampson, Raudenbush 和 Earls (1997) 研究 了 社区 特征 与 芝加哥 各 社区 杀 
人 犯罪 率 之 间 的 联系 。 首 先 ， 他们 将 这 个 城市 分 为 342 个 小 区 群 (neighbor- 
hood clusters, 简 标 为 NC) ， 它 们 为 地 理 上 紫 邻 的 地 区 ， 并 与 当地 社区 相 吻 合 。 
以 前 的 研究 已 经 发 现 ， 集 中 不 利 条 件 (变量 名 为 CONDIS) 的 小 区 有 很 高 的 杀人 
TORY 研究 目的 在 于 这 种 联系 在 多 大 程度 上 能 够 被 小 区 的 关系 性 质 所 解释 。 
研究 人 员 使 用 整个 城市 的 包括 8000 个 居民 的 调查 数据 对 342 个 小 区 群 分 别 建立 
了 一 个 关于 “集体 功效 ”( collective efficacy) 的 测量 指标 来 表示 邻居 之 间 互 相 了 
解 的 程度 、 共 享 的 价值 观 、 互 相依 赖 和 和 干预 以 保持 公共 秩序 的 程度 。 读 者 可 以 参 


四 根据 1990 年 普查 数据 ,集中 不 利 条 件 是 一 个 台 成 指标 ,包括 小 区 的 贫困 率 ， 领 取 公 共 资 助 的 
比例 ， 女 性 户主 的 比例 、 失 业 率 、18 岁 以 下 的 人 口 比例 . 非 认 毅 比 例 。 如 上 最 后 两 项 基因 为 
BERN, FAEN T R iE e E FER, R, HER REET EY A 
主 的 家 庭 中 。 
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看 1997 年 论文 中 的 细节 ， 这 里 只 提供 简化 了 的 分 析 。 

图 10. 2a 显示 了 1995 年 观测 的 各 小 区 平均 每 10 万 人 中 杀人 犯罪 率 的 直方 
图 。 众 数值 是 0， 说 明 犯 罪 率 是 高 度 偏 态 的 。 很 清楚 ， 没 有 办 法 能 将 这 些 数据 
进行 正 态 化 转换 。 图 10. 2b 显示 了 集中 不 利 条 件 与 观测 犯罪 率 之 间 的 联系 。 在 
图 的 左下 角 ， 案 例 高 度 集中 ， 当 集中 不 利水 平 增加 时 ， 犯 罪 率 方差 的 异 质 性 也 
增 大 。 此 外 ， 集 中 不 利水 平 与 杀人 犯罪 率 之 间 的 关系 表现 出 是 非 线性 的 。 然 而 
为 了 简单 起 见 ， 我 们 先 考 虚 一 个 线性 回归 模型 。 估 计 的 方程 为 : 


= 30.96 + 21.0 x (CONDIS), { 10, 23] 


Ep, Y 是 小 区 j 中 平均 每 10 万 人 中 的 杀人 犯罪 率 ，CONDIS 已 经 经 过 标准 化 ， 
平均 值 为 0、 方 差 为 1!。 这 一 方程 将 会 对 6 个 小 区 得 出 负 的 杀人 犯罪 率 期 望 值 。 
所 有 这 些 特点 ， 即 其 结果 的 半 连 续 本 质 (在 0 什 上 有 高 频数 )、 自 变量 与 结果 之 间 
的 非 线性 关系 、 残 差 的 异 质 性 、 得 出 负 的 预测 值 ， 都 说 明 应 该 采用 非 线 性 回归 。 然 
而 ， 对 犯罪 率 做 多 ”= log(1 +Y) 转换 ， 虽 然 消 除了 预测 值 超出 界限 的 问题 ， 但 其 
他 问题 仍然 存在 。 此 外 ， 在 采用 log(1 +Y) 量度 后 ， 自 变量 的 效应 规模 便 难以 解释 
了 。 这 些 问题 通过 残 差 方差 与 平均 值 成 比例 的 非 线 性 模型 来 解决 就 会 好 得 多 。 


标准 差 =36.4 
平均 数 =31.0 
总 频数 =342 





SS SS Wie 


AR 下 
杀人 犯罪 率 


图 10. 28 芝加哥 各 小 区 每 10 万 人 中 杀人 犯罪 率 的 直方 图 
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1 
不 利 条 件 集中 度 
图 10.2b 杀人 犯罪 率 与 集中 不 到 条 件 的 标 绘图 


层 -1 模型 。 结 果 Y 是 1995 年 在 小 区 群 NC, 中 发 生 的 杀人 案 数量 ，m, 是 小 
区 群 按 1990 年 普查 的 人 口 数 ， 测 量 单位 是 10 万 人 。 于 是 ， 对 小 区 群 NC 的 杀人 
案 数 量 的 模型 自然 设 为 E(Y | )= maA, 。 而 在 泊 松 模型 中 ， 方 差 与 平均 数 相等 ， 
即 Var(¥,|A,) = mA; 。 采 用 对 数 连接 函数 n，= log(A,) ， 便 得 到 层 -1 模型: 


ny = Ba [10.24] 


乍 看 起 来 这 显得 反常 ， 层 - 1 结果 只 有 一 个 下 标 j， 怎 么 会 说 这 是 一 个 两 层 模 
型 呢 ? 关键 的 一 点 是 存在 两 个 来 源 的 变异 : 一 个 是 给 定 A, RAPHY, 的 抽样 
方差 ; 另 一 个 是 小 区 之 间 在 A 本 身上 的 方差 。 在 泊 松 模型 中 ,给 定 A, 条 件 下 
的 7 的 抽样 方差 仅仅 依赖 于 入。 于 是 ,在 泊 松 模型 中 估计 层 -1 方差 时 便 没 有 
自由 度 余地 。 这 种 问题 类 似 于 第 7 章 中 研究 综合 的 情况 。 我 们 可 以 将 每 一 个 小 
区 看 作 是 一 次 “研究 ”， 均 可 以 从 已 知 方差 估计 出 一 个 效应 规模 和 Aj。 

层 -2 模 型 。 层 -2 模型 是 将 小 区 之 间 在 对 数 犯罪 率 上 的 变异 作为 解释 变 
基 的 函数 ， 再 加 上 一 项 正 态 分 布 随机 误差 ， 


By, = Yoo + Yo (CONDIS), + yor( COLLEFF), + ug 
[10.25] 


uy ~ N(0,T%) 
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表 10.5 提供 了 三 种 模型 的 具体 小 区 估计 和 总 体 平均 估计 : (a) 无 条 件 模 
型 ，(b) 将 集中 不 利 条 件 情 况 作为 自 变量 的 模型 ，(c) 将 集中 不 利 情况 和 集 
体 功 效 作为 自 变量 的 模型 。 


表 10.5 芝加哥 的 对 数 犯罪 率 的 对 数 线性 模型 














具体 单位 模型 ，po 
E — (b) (e) 
GET AI 系数 s exp (系数 ) 系数 so exp {系数 ) 系数 到 ”exp( 系数) 
“UE, Yo 3.164 0.063 23.69 3.124 0.054 2274 3.098 0.055 225 | 
CONDIS, Yo 0.678 0.049 197 0523 0.061 1.69 
COLLEFF, yp -1.068 0.261 0.34 
层 -2 方差 ,rm 0.775 0. 353 0. 323 
SMM, By 
RE. yo 3.419 0.058 30.54 3.195 0.051 24.41 3.168 0.052 23.76 
CONDIS, yo 0.738 0.045 2.09 0589 0.057 1.80 
COLLEFF, Yy -0.978 0.248 0.38 
描述 性 统计 
频数 平均 值 标准 差 
CONDIS E 0. 903 0.993 
COLLEFF 342 0.000 0.263 
HOMICIDE 342 2.325 2.678 


无 条 件 模型 结果 。 无 条 件 的 层 -2 BMH: 
Bo, = Yoo + tt, [ 10. 26) 
在 这 个 模型 下 ， 小 区 7 在 其 特定 随机 效应 uo 条件 下 的 发 生 率 为 : 
Ay = exp 1 Yo + ui [10.27] 
表 10. 5 的 估计 为 yo =3. 165, To) =0.775 。 图 10.3 在 横 轴 上 显示 了 基于 这 些 
估计 的 小 区 对 数 发 生 率 的 95% 可 信 值 区 间 。 这 一 区 间 是 关于 平均 值 zw =3. 165 


对 称 的 ， 其 标准 差 为 V3, = V0.775 =0.880。 于 是 ， 在 正 态 条 件 下 我 们 将 期 望 
有 95% 的 小 区 对 数 发 生 率 处 于 3. 165 + 1.96 x0.880 = (1.44, 4.89) 的 区 间 之 
内 。 纵 轴 又 提供 了 换算 的 发 生 率 A;， 其 中 %% 可 信 值 区 间 为 [exp(1.44), exp 
(4,89) ] =(4.22，132.95)。 因 此 ， 假 定 对 数 发 生 率 为 正 态 分 布 ， 可 期 望 大 多 
数 杀 人 犯罪 率 水 平 处 于 平均 每 10 万 人 4. 22 ~ 132. 95 起 案件 的 范围 之 内 ， 这 表 
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明 不 同 小 区 存在 着 巨大 差异 。 注 意 , 与 随机 效应 为 0 相 联 系 的 发 生 率 为 
exp(3.165) =23.69， 并 不 是 处 于 期 望 的 95% 区 间 的 中 心 上 。 











对 数 犯罪 率 
图 10.3 具体 小 区 的 杀人 犯罪 率 作为 具体 小 区 的 杀人 犯罪 率 对 数 的 函数 


注 : 纵向 的 岩 线 标志 的 是 具体 小 区 的 对 数 发 生 率 的 95%5 预测 区 间 的 界限 ， 而 横向 的 典 
线 标志 的 是 对 其 体 小 区 案件 发 生 率 的 95% 预测 区 间 的 界限 【图 中 lambda 即 文中 的 入 ，eta 即 文 
中 的 ) 。 
在 模型 假设 条 件 下 ， 对 数 发 生 率 关 于 3. 165 对 称 ， 发 生 率 是 正 偏 态 的 ， 有 
中 位 数 为 23. 69 ， 而 平均 数 大 于 中 位 数 。 在 对 数 连接 的 情况 下 ， 具 体 单位 与 总 
体 平均 的 期 望 值 之 间 存 在 着 一 种 确切 的 关系 : 


El expl yoo + uo)] = exp( yo + Tw/2) 
= exp(3. 165 + 0.775/2) = 34.90 


[10.28] 


这 一 方程 表明 ， 平均 数 和 中 位 数 之 间 约 相差 一 个 信 数 exp{ 二 rw] o TE rw 很 小 


时 ,它们 将 非常 接近 。 实 际 上 ， 总 体 平均 估计 的 yo。=3.419 ( 见 表 10.5 的 中 
间 部 分 ) ， 所 求 得 的 平均 发 生 率 估计 为 exp(3.419) = 30.5。 这 个 数值 与 方程 
10. 28 计算 的 数值 有 一 定 差别 ,因为 具体 单位 估计 与 总 体 平均 估计 在 估计 
层 -2 系数 时 在 加 权 上 存在 一 些 差别 。 

条 件 模型 。 表 10.5 的 (b) 栏 显示 ， 在 具体 单位 模型 中 ， 小 区 集中 不 利 
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条 件 与 对 数 犯罪 率 之 间 有 很 强 的 正 关联 ，yo =0.678, se =0.049。 集 中 不 利 条 
件 上 一 个 标准 差 的 增 量 (sdiowm = 0.993) 导致 发 生 率 变化 exp (0.993 x 
0.678) =1.96 倍 ， 或 者 说 杀人 犯罪 率 会 递增 96% 。 在 小 区 方差 之 间 的 残 差 估 
计 为 0.353 ， 比 无 条 件 模型 的 方差 0.775 的 一 半 还 少 。 

根据 表 10.5 中 的 (c) 栏 ， 集 体 功效 显著 地 与 对 数 犯罪 率 负 相关 ，7y， = 
— 1.068, se=0.26。 如 果 有 两 个 小 区 在 集体 功效 方面 相差 一 个 标准 差 
(sdeouerr =0. 263) ， 这 就 意味 着 ， 在 集中 不 利 条 件 不 变 的 条 件 下 ， 集 体 功效 较 
高 的 小 区 的 犯罪 率 是 集体 功效 较 低 的 小 区 的 犯罪 率 的 100 x exp [0.263 x 
( -1.068)] =76% ， 也 就 是 说 减少 了 0. 24 倍 或 减少 了 24% , 

层 -1 油 松 分 布 的 离散 情况 。 如 前 所 述 ， 如 果 数 据 服 从 假定 的 层 - 1 抽样 
模型 ， 那 么 层 -1 的 为 的 泊 松 方差 将 是 wj ， 这 里 ， 


w, = mA [10.29] 


但 是 ， 如 果 层 - 1 数据 并 不 服从 这 个 模型 ， 实 际 层 -1 方差 可 能 会 大 于 假设 的 
方差 ( 即 过 离散 ) 或 小 于 假设 ( 即 欠 离散 )。 正 如 二 项 模型 的 情况 ， 我 们 有 可 
能 推广 这 个 模型 ， 使 之 包括 一 个 标量 方差 分 量 o*， 因 而 层 -1 方差 成 为 wo 
但 是 值得 注意 的 是 ， 我 们 拥有 的 小 区 数据 并 不 能 估计 出 o*。 由 于 每 个 小 区 只 
有 一 个 和 A。， 因 此 没有 剩余 的 自由 度 来 估计 o*。 这 可 以 通过 存 每 个 小 区 中 包括 
多 种 计数 加 以 解决 ， 比 如 按 每 一 个 年 龄 组 来 计数 。 


对 序 次 数据 的 分 层 模 型 


在 许多 社会 科学 和 医学 研究 应 用 中 ， 序 次 分 类 结果 是 很 常见 的 。 比 如 ， 在 
态度 的 调查 中 要 估计 人 们 对 某 种 说 法 的 赞同 程度 ， 将 其 反应 记录 为 “很 同 
意 ” “同意”、“ 中 立 ”"、“ 不 同意 ”、“ 很 不 同意 ”。 儿 童 发 展 研究 者 会 询问 儿 
童 表现 的 某 种 行为 特征 的 频率 ， 比 如 羞涩 和 骚扰 ， 而 反应 的 选项 为 “从 不 ”、 
“有 时 ”、“ 经 常 ” 。 在 一 些 研究 中 ， 感 兴趣 的 结果 本 来 是 连续 变量 ， 比 如 年 收 
人 ,但 是 所 获得 的 数据 已 经 被 划分 为 类 别 组 (如 “高 "、“ 中 ”、“ 低 ") 。 在 所 
有 这 些 情况 下 ， 结 果 数 据 告诉 我 们 案例 是 如 何 排序 的 ， 但 是 却 没有 建立 案例 之 
间 在 结果 上 的 距离 。 序 次 回归 模型 设置 了 解释 变量 与 最 终 序 次 结果 之 间 的 联系 
(参见 Agresti，1996， 第 8 章 ; Long，1997， 第 5 章 ; McCullagh & Nelder, 
1989, 第 5 章 )。Hedeker 和 Gibbons (1994) 将 这 一 原理 扩展 到 多 层 的 场合 ， 
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还 可 以 参见 Goldstein (1995, $ 108 页 ) 的 论述 。 


对 单 层 数据 的 累计 概率 模型 


序 次 回归 的 标准 模型 是 累计 概率 模型 ， 它 的 原理 可 以 用 一 个 简单 的 例子 来 
说 明 。 假 设 我 们 有 一 套 关于 教师 工作 情况 的 数据 ， 特 别 是 其 中 包含 以 下 问题 : 
“假如 你 能 够 回 到 大 学 重新 开始 学 习 ， 你 是 否 还 选择 教师 作为 职业 ?” 可 能 的 
回答 : 1 = 是 ; 2 = 不 确定 ; 3 = 杏 。 我 们 的 研究 兴趣 在 于 ， 教 师 们 的 万 些 特征 
可 以 被 用 来 预测 其 对 这 个 问题 的 回答 。 

通过 构思 一 个 潜在 的 连续 变量 :， 表 示 “ 歼 业 度 "， 便 能 够 应 用 序 次 回归 
模型 。 图 10. 4 显示 了 这 一 潜在 变量 与 反应 数据 之 间 的 关系 。 散 业 度 很 低 的 教 
师 会 有 很 高 的 概率 选择 “ 否 ” 作 为 回答 。 当 : 值 很 小 时 回答 “ 否 ” 的 概率 便 
很 大 。 当 然 ， 这 还 意味 着 回答 “不 确定 ”和 “是 ”的 概率 会 很 小 。 然 而 ， 当 = 
值 增 大 一 些 ， 即 对 教学 的 敬业 度 为 中 等 时 ， 回 答 “ 否 ”的 概率 就 会 碱 小 ， 而 
回答 “不 确定 ”和 “是 ”的 概率 便 会 增加 。 当 : 值 很 高 时 ,“ 否 ”的 概率 就 会 


一 一 回答 “是 ”的 概率 
— uF “不 确定 ”的 概率 
- - - - 回答 “ 理 ” 的 概率 





Z， 敬 业 度 


图 10.4 MERLE (MM) 与 回答 “是 /不 确定 / 否 ” 的 
概率 (AM) 之 间 的 关系 
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变 得 非常 小 ,而 “不 确定 ”也 变 得 很 小 ， 因 为 这 些 教师 热爱 教学 ， 因 而 他 们 
当然 还 是 选择 从 事 教学 。 于 是 当 = 值 非常 高 时 , “是 ”的 概率 便 非常 高 ; 与 与 


此 相反 ， 另 外 两 种 概率 变 得 很 小 。 
将 这 种 思路 表达 为 公式 ， 一 般 而 言 ， 我 们 有 M 种 可 能 的 排序 类 别 ， 
m=l, =, Mo RMR RHE HR, 当 RK m 值 时 概率 为 : 


Pa = Prob(R = m) 


在 上 述 例子 中 ，MH =3， 并 且 
p, = Prob(R = 1) = Prob(“ 是 ") 
Pı = Prob(R = 2) = Prob( “不 确定 ") 
P, = Prob(R = 3) = Prob(“ 7") 
为 了 用 一 个 回归 公式 反映 数据 的 排序 本 质 ， 采 用 累计 (cumulative) 概率 
比 直接 采用 概率 本 身 更 为 方便 。 我 们 将 这 些 累 计 概率 表示 为 : 


Pa = Prob(R<m) = p, +9, + +9, [10.30] 


在 我 们 示范 例子 中 , .有 : 
: = Pr 
G2 =O +e: (10.31) 


P =e +e. +9; =1 


HER, of =1 是 元 余 的 。 总 而 言 之 ， 只 有 MM - 1 个 累计 概率 需要 关注 ， 因 为 在 
所 有 研究 中 都 有 "= 1。 

图 10.5 为 我 们 的 例子 画 出 了 累计 概率 与 : 之 间 的 联系 。 注 意 ， 实 线 代表 
的 p; 与 图 10.4 中 的 p, 相同 ， 而 图 10.5 中 的 虚线 是 p, +0, 的 合计 。 累 计 要 
率 的 思路 自然 地 引 向 了 累计 logit: 





=) to Em) [10,32] 


— — Prob(R > m) 


其 中 m=1，…, M -1。 我 们 现在 可 以 写 出 一 个 简单 的 logistic 回归 模型 : 


Nu = 0, + BX, (10. 33] 
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图 10.5 MERLE (MR) 与 累计 概率 (WM) 之 间 的 关系 


模型 中 对 每 一 个 类 别 m 各 有 一 个 截 距 g.， 称 为 “门槛 ” (threshold); 还 有 一 
个 共同 的 斜率 B。 方 程 10. 33 称 为 “成 比例 发 生 比 ”( proportional odds) 模型 。 
假如 我 们 比较 一 下 两 个 案例 的 期 望 对 数 发 生 比 ， 第 一 个 案例 有 X=X,， 第 二 个 
RAMAN =X: ， 那 么 两 个 案例 之 间 在 对 数 发 生 比 之 间 的 期 望 差异 为 : 


Na = Mas = BCX, - X,) (10. 34] 


注意 ， 它 并 不 依赖 于 站 。 于 是 ,不同 邯 值 的 案例 之 间 在 对 数 发 生 比 上 的 期 望 关 
异 并 不 依赖 于 特定 的 类 别 。 这 两 个 案例 之 间 的 相对 发 生 比 为 ; 

Sane = ep8, - X,)] [10.35] 
因此 ， 成 比例 发 生 比 模型 有 一 个 关键 的 假定 ， 即 X 在 每 一 类 别 m 中 都 以 同样 
的 形式 影响 相对 发 生 比 。 一 般 必须 对 这 一 假定 进行 检查 ; 在 我 们 下 一 节 提供 的 
一 个 例子 中 ， 这 一 假定 便 不 能 成 立 。 注 意 ， 这 个 模型 还 假定 ， 对 任何 六 ， 不 同 
类 别 (如 m=1 和 m=2) 中 的 任意 两 个 累计 logit (0m, Mm) 之 间 在 对 数 发 
生 比 上 的 差别 只 依赖 于 各 类 的 截 距 ， 即 ，; 
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m- = 8, ~ 8 { 10. 36] 


it A tk FX. 
扩展 到 两 层 模 型 


按照 我 们 的 例子 ， 设 教师 还 嵌 套 于 不 同 的 学 校 ， 于 是 我 们 有 一 个 层 -1 自 
变量 六， 测量 学 校 中 的 教师 ; 在 教学 任务 上 的 多 样 性 。 根 据 组 织 理 论 ， 我 们 
假设 任务 多 样 性 会 提高 教师 的 敬业 度 。 于 是 我 们 的 层 - 1 模型 变 为 : 


My = Oy + BX,, [10.37] 


My = Cy + BX, 
方程 10. 37 产生 的 问题 是 ,存在 着 三 种 潜在 的 随机 系数 :对 应 《的 斜率 Bi， 以 
及 两 个 门槛 .和 9,。 但 是 ， 要 想 让 两 个 门槛 随机 变化 ， 便 很 难 解释 其 结果 。 它 
意味 着 ， 教 师 的 敬业 度 :, 在 解释 不 同 反 应 类 型 时 在 不 同 的 学 校 之 间 有 不 同 的 形 
式 。 此 外 ， 这 种 做 法 还 要 求 每 个 学 校 至 少 有 两 项 随机 效应 ， 并 且 它 们 可 能 是 高 度 
相关 的 。 当 反应 的 类 别 数 增加 时 ， 这 种 解释 上 和 估计 上 的 问题 也 会 随 之 增加 。 
更 适当 的 研究 方法 是 对 差异 进行 分 析 : 


8=0, -0, [10.38] 
并 且 还 要 加 上 一 个 共同 的 截 距 Bu 。 于 是 我 们 的 数据 层 - 1 模型 将 成 为 : 


™ = By + Puls [10. 39] 
Ny = Py + BAX, +8 
这 一 模型 容许 整 层 所 有 学 校 的 教师 敬业 度 Bu 随机 变化 ; X WREE B, th AT Le 
本 书 中 许多 例子 那样 随机 变化 。 但 是 ,门槛 8 被 保持 不 变 ， 尽管 在 原则 上 它 也 
可 以 变化 。 
Ke -1 结构 模型 。 推 广 到 1 个 类 别 后 ， 层 - 1 模型 变 为 ， 


Nae = Bo, + > Pak + Fo. [10.40] 


其 中 ，D 是 表示 类 别 m 的 标识 变量 。 
层 -1 抽样 模型 。 如 同一 般 化 线性 模型 的 其 他 情况 ， 也 需要 考虑 层 -1 抽 
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样 模型 。 当 数据 具有 序 次 性 质 时 ， 我 们 将 单位 站 的 案例 i 的 MH -1 个 虚拟 变量 
Y, Ying XH: 


4 R < mit, Yu = 1; SIM, = 0 [10.41] 


ys 


比如 在 我 们 的 例子 中 有 W =3， 因 此 有 : 


当 Ri = 1 时 ， Ys=1 
4R,<28t, Yy =1 


[10. 42] 


FE, MK pl, = Prob(y,, = 1) 为 累计 概率 ， 并 且 还 可 以 证 明 : 


E( Yay] Pay) = Pay 
Var( Ya,le.y) = pull ~ piy) [10.43] 
Cov( V.. Fag! PaPa) = Pu - Gey) 
层 -2 模型 。 层 -2 模型 为 通常 形式 : 


Bu = yn + Dr, tuj [10.44] 
sat 


其 中 ， 随 机 效应 xu 既 可 以 估计 出 来 ， 也 可 限制 为 对 所 有 /都 为 0。 通 常 ， 我 们 
假定 这 些 随 机 效应 为 多 元 正 态 分 布 。 


一 个 例子 : 教师 控制 力 与 教师 敬业 度 


数据 来 自 1990 年 在 加 利 福 尼 亚 州 和 密 歌 根 州 对 16 所 公立 学 校 的 650 名 教 
师 所 进行 的 调查 。 调 查 有 意识 地 选择 了 不 同 规模 、 组 织 结构 、 城 乡 位 置 的 学 
校 。 结 果 变 量 还 是 已 经 描述 过 的 、 分 三 类 的 教师 敬业 度 测量 。 

无 条 件 模型 。 为 了 估计 在 没有 协 变量 情况 下 的 学 校 之 间 的 差异 ， 我 们 定义 
B-1 模型 为 : 


Tm; = By + Da (10. 45} 


其 中 ，D;, 是 标志 是 否 m =2 的 虚拟 变量 ( 即 当 m=2 时 ，D,, =1; 当 m=1 时， 
Dy =0)。 于 是 ， 这 个 公式 概括 了 两 个 方程 ; 


mw = By 
Ny = By + ôy 


(10. 46] 
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在 层 -2， 模 型 也 是 标准 形式 


Bo, = Yoo + My» vy ~ N(0, Tu) 
y =ô, [10.47] 


结果 ( 见 表 10.6) 表明 yw =0.222, =1.027, 7 =0. 126, 


表 10.6 教师 敬业 度数 据 的 累计 logit 模型 











(a) 无条件 模 型 (b) 条 件 宰 型 
e & 系数 标准 误 se tE 系数 å 标准 误 :比率 
RH, yo 0.222 0. 123 1.795 0. 334 0. 090 3.27 
— bin Lsa oss an 
TASK VARIETY (任务 多 样 性 ) 
0. 349 0.087 4.00 

HE, yo 
THRESHOLD DIFFERENCE 

UMER), 8 1.027 0. 078 13. 100 1.055 0. 081 13.05 
层 -2 方 差 , rm 0. 126 0.00 

描述 性 统计 教师 敬业 度 

变量 FERE FHA ež 取 值 Me 频率 累计 频率 
TASK VARIETY 650 0. 000 0. 884 1= 是 354 54.5 54.5 
TEACHER CONTROL 16 0. 009 0.324 2= 不 确定 144 22.2 16.6 


3=8 152 23.4 100 
TE: a 所 有 估计 基于 具体 单位 寞 型 - 


条 件 模型 。 然 后 ， 我 们 考虑 在 这 个 模型 中 纳入 自 变量 。Rowan、Rauden- 
bush 和 Cheong (1993) 假设 ， 当 教师 的 工作 有 较 高 程度 的 任务 多 样 性 ， 并 且 
能 对 学 校 政策 和 教学 条 件 有 较 高 控制 力 时 ， 教 师 将 会 有 较 高 的 敬业 度 。 从 道理 
上 说 ,任务 多 样 性 (TASK VARIETY) 是 在 教师 层次 变化 ， 而 教师 控制 力 
(TEACHER CONTROL) 是 在 学 校 层次 变化 (细节 请 参见 Rowan 等 人 1993 年 
的 论文 )。 层 - 1 模型 为 


Thay = Bo + By x (TASK VARIETY), + Dy;ôy [10.48] 


而 层 -2 模型 为 : 


Ba = Ym + Yu (TEACHER CONTROL), + uy 
By = Yo [10.49] 


ôy = 5; 
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SAR (W106) 表明 ， 在 学 校 之 内 ,任务 多 样 性 与 敬业 度 显著 相关 ，Y,。= 
0. 349，t =4. 00。 而 在 学 校 之 间 ， 教 师 控制 力也 与 敬业 度 显著 相关 ，7o =1. 541， 
t=4.22。 教 师 控制 力作 为 自 变量 被 纳 人 模型 便 将 学 校 之 间 方 差 的 点 估计 减少 到 
0.00. 图 10.6 和 图 10.7 显示 了 预测 的 累计 logit 与 作为 TEACHER CONTROL 
的 函数 预测 的 累计 概率 (保持 TASK VARIETY 值 在 总 平均 值 水 平 不 变 ) 。 对 回 
答 “ 是 ”的 预测 概率 随 教师 控制 力 的 提高 而 增加 ， 而 回答 “是 ”或 “不 确定 ” 
的 概率 也 是 这 样 。 当 教师 控制 力 变 得 非常 高 时 ， 这 两 种 概率 会 收敛 到 一 起 ， 也 
就 是 说 ， 在 教师 有 极 高 控制 力 的 学 校 中 ， 教 师 对 教育 的 敬业 也 没有 保留 。 

















-0.6 -04 -0.2 0.0 0.2 04 0.6 
教师 控制 力 


图 10.7 作为 教师 控制 力 (RM) 函数 的 累计 概率 ( 纵 轴 ) 估计 


对 多 项 数据 的 分 层 模型 


上 一 节 讨 论 了 序 次 的 多 分 类 结果 研究 。 然 而 ， 多 分 类 结果 之 间 经 常 并 不 具有 
清楚 的 排序 。 在 有 些 情况 下 ， 数 据 的 序 次 性 质 是 有 争议 的 ， 因 而 关于 发 生 比 成 比 
例 的 关键 性 假设 便 存在 问题 。 这 时 ， 多 项 回归 模型 便 很 有 用 了 。 

我 们 还 是 用 实例 来 介绍 关键 的 思路 。 全 国教 育 历时 研究 (National Educa- 
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tional Longitudinal Study, NELS) 使 我 们 可 以 用 家 庭 背景 和 中 学 经 历来 预测 人 在 
青年 时 期 的 发 展 趋向 。 具 体 而 言 ， 我 们 关注 20 岁 的 青年 处 于 以 下 哪 种 情况 : 
(a) 进入 四 年 制 的 学 院 ; (b) 进入 两 年 制 的 学 院 (或 社区 学 院 ); (c) 不 再 
继续 升学 。 尽 管 这 三 类 结果 也 可 以 被 视 为 是 有 序 的 ， 但 我 们 倾向 于 怀疑 决定 进 
入 由 年 制 学 院 的 背景 和 经 历 会 有 别 于 决定 进入 两 年 制 学 院 的 背景 和 经 历 。 如 果 
真是 这 样 ， 上 一 节 关 于 发 生 比 成 比例 的 假设 便 不 成 立 。 更 重要 的 是 ， 关 于 不 同 
过 程 导致 不 同 升学 结果 的 有 用 信息 便 会 丧失 。 
于 是 ， 我 们 所 寻求 的 是 一 种 容许 层 -1 自 变量 与 不 同 升学 类 型 的 概率 之 间 

有 不 同 联系 的 回归 模型 。 现 在 还 是 有 村 类 可 能 的 结果 。 像 以 前 一 样 ， 反 应 RR 
在 取 值 m 时 的 概率 为 Prob(R =m) = gp。, m = 1,…,M 。 在 本 例 中 有 三 类 去 向 
结果 ， 于 是 WH =3， 并 且 有 : 

Prob(R，= 1) ps 

Prob(R, = 2)@2 (10. 50) 


Prob(R, = 3) = gy =1 — Pig ~ Ow 


注意 ， 只 需要 对 MW -1 = 2 种 概率 来 设置 可 能 的 结果 。 
层 -1 抽样 模型 


AY A - 1 的 抽样 模型 ， 我 们 设立 的 虚拟 变量 为 : 
M R; = mat, Yy = 1 MY, = 0 
根据 多 项 分 布 ， 在 给 定 wy 时 ，Y; 的 期 望 值 和 方差 分 别 为: 
E(。|wp) = Pays Var( Vay] pm) = Pos(l - Pny) [10.51] 
在 结果 yw 与 ys 之 间 的 协 方差 为 ; 


Cov( Yay! Pay Pay) =— Pn Pai [10.52] 


层 -1 连接 台数 


通常 ， 多 项 回归 模型 的 连接 函数 是 多 项 logit 连接 。 对 每 一 类 别 m = 1，…， 
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M -1， RHA: 


f=) s vel Prob( R, = m) [10. 53} 


Pui Prob(R, = M) 
于 是 ， 层 -1 结果 是 进入 某 一 类 别 m 相对 于 类 别 M 的 对 数 发 生 比 。 我 们 将 类 
BM RA “SRR”, 


Tay = log( 


层 -1 结构 模型 
在 层 -1 中 ,我 们 有 : 
Qn 
mu = Bons + D Buns kw [10.54] 
Hep, m=1, =, M-1, Ei, 4 M=3 时 ,将 分 别 有 对 mr 和 ?的 两 个 
层 -1 方程 : 
M 
Thy = Byn + D Funke 
[10. 55} 
Ty = Byn + EPen 
层 -2 模型 
层 -2 模型 有 对 应 的 形式 : 
Ban = Yara + 7 ,0 + vm) [10. 56] 


其 中 ,gq =0，…，Q。。 比 如 ， 当 M =3 时 ， 存 在 两 套 层 -2 方程 ， 这 将 在 后 面 
示范 。 


示范 例子 : HRA 
无 条 件 模型 。 回 到 我 们 关于 升学 去 向 的 例子 。 我 们 先 估计 一 个 无 条 件 模 


型 仅仅 是 为 了 测量 学 校 之 间 在 两 种 结果 上 的 差异 ， 即 进入 四 年 制 学 院 ( 相 
对 于 不 升学 ) 的 对 数 发 生 比 5。， 以 及 进入 两 年 制 学 院 ( 相 对 于 不 升学 ) 的 对 
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数 发 生 比 Myo 
于 是 我 们 有 了 一 对 层 -1 方程 : 


Thy = Bors [10. 57] 
Ny = Bam 


根据 这 个 模型 ， 每 一 对 学 生 的 对 数 发 生 比 等 于 具体 学 校 的 截 距 。 
在 层 -2， 具体 学 校 的 截 距 存 在 学 校 之 间 的 随机 变化 : 


Bojer = Yous + uo 


Bo = Your) + Ugi 


ad 


Your) Tæ Toonz 


[10.58] 


ER 10.7 中 ,我 们 看 到 ， 对 于 “典型 学 校 ” 的 学 生 ， 进 人 四 年 制 学 院 的 
对 数 发 生 比 大 于 不 升学 的 对 数 发 生 比 ， 有 Yoo, = 0.306 ，! =2.75; 而 进入 两 
年 制 学 院 的 对 数 发 生 比 却 小 于 不 升学 的 对 数 发 生 比 ， 有 Pon = - 0.605, t= 
-6.32。 进 入 四 年 制 学 院 (相对 于 不 升学 ) 的 对 数 发 生 比 在 学 校 之 间 存 在 统 
计 性 显著 的 差异 , foua = 1.135, y = 379, df = 175, p = 0.000 。 但 是 ， 学 
校 之 间 在 进入 两 年 制 学 院 ( 相对 于 不 升学 ) 的 对 数 发 生 比 上 却 没 有 明显 的 差 


R107 升学 结果 数据 的 多 项 logit 模型 





(a) 无 条 件 模型 (b) 条 件 模型 

固定 效应 系 数 se + 比率 系数 sw {比率 

第 1 类 
RE, Boys BB, You 0.306 OIH 2.75 ©0181 0.112 1.61 
CATHOLIC, Yoi) 1.194 0.314 3.80 
PRIVATE, Yoi; 0.606 0.296 2.05 
FEMALE #¥ , Bixi) Yio 0.567 0.161 3.52 
ASIAN 斜率 , Bao) Yau 0.832 0.260 3.20 
HISPANIC 斜率 , By wo 0.392 0.248 1.58 
BLACK 斜率 , Buyon Yn 0.697 0.263 2.65 
PRE-MATH 斜率 , py) Yso 0.087 0.008 10.88 
TWO-PARENT $44, Bs，， Yoo) 0.317 0.169 1.87 


SES HÆ , Brn) Yw 0.792 0.129 6.16 
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续 表 10.7 
(a) 无 条 件 模型 (b) 条 件 模型 
pe ar 系 数 se 4 比率 系 & set 
— — — 
ME. > RE, yoi: -0.605 0.096 -6.32 -0.296 0.112 -2.65 
CATHOLIC, Yora) -0.520 0.413 -1.26 
PRIVATE, Yonn -0.504 0.343 -1.47 
FEMALE 斜率 , Bin Yin 0.098 0.168 0.56 
ASIAN 和 斜率, By Yam 0.372 0.272 1.37 
HISPANIC 斜率 ,By Ywin 0.423 0.233 1.81 
BLACK 斜率 , Buyo Yam -0.490 3.315 -1.56 
PRE-MATH 斜率 , Bsn; Ysa 0.021 0.008 2.45 
TWO-PARENT 斜率 , B62 Yours 0.129 0.174 0.74 
SES PHE, Bo Yma 0.532 0.134 3.97 
J BEDE 
HH g Torn) 1.135 0. 333 
Top12)00(2) 0.039 0.171 
协 方差 Toni 110002) ~0. 523 ~0. 209 
E HAR EER 频 数 - 平均 从 FEE 。 最 小 值 。 ”最 大 什 
FEMALE 1259 0. 48 “0.50 0.00 1.00 
ASIAN 1259 0.15 0.36 0.00 1.00 
HISPANIC 1259 0.17 0.37 0. 00 1.00 
BLACK 1259 0.12 0.32 0.00 1.00 
PRE-MATH 1259 38.81 12.51 16, 58 66.81 
TWO-PARENT 1259 0.65 0.48 0.00 1.00 
SES 1259 0.10 0.81 -2.23 1.85 
学 校 层次 描述 性 统计 频数 平均 值 RES 。 最 小 值 RX 
PUBLIC 176 073 0. 45 0.00 1.00 
CATHOLIC 176 0.13 0.33 0.00 1.00 
PRIVATE 176 0.15 0.36 0.00 1.00 
ER: ARR 频 数 百分比 
1 四 年 制 学 院 ~ 48.4 
2. 社区 学 院 296 19.5 


3. 未 升学 
rr — — 
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别 .和 wa = 0.304 T,y? = 189 ，df=175, p=0.21。 因 此 ， 未 来 在 分 析 中 还 
可 以 简约 地 将 随机 效应 uya 限制 为 0。 当 多 项 模型 的 结果 中 类 别 数 很 多 时 ， 这 
种 限制 将 可 能 特别 有 用 。 
条 件 楼 型 。 我 们 现在 来 检查 .在 控制 了 八 年 级 的 数学 成 绩 以 及 性 别 、 民 
族 、 社 会 经 济 状况 、 家 庭 结构 以 后 ， 私 立 学 校 的 学 生 是 否 有 较 高 的 升学 率 。 
层 -1 的 一 对 logit 模型 现在 成 为 性 别 标识 (FEMALE， 表 示 女 性 ) RK 
标识 (ASIAN, BLACK, 、HISPANIC ， 分 别 表示 亚 裔 、 黑 人 和 西班牙 裔 ) ， 社 会 
经 济 状况 (SES， 为 家 庭 收入 、 父 母 教育 程 度 、 父 母 职业 的 合成 指标 ) ,家庭 
结构 标识 (TW0-PARENT， 表 示 父 母 双全 ) 以 及 八 年 级 数学 成 绩 (PRE- 
MATH) 的 函数 。 于 是 对 m=1，2， 有 : 
Nay = Borm + Binas x (FEMALE), + By.) * (ASIAN), 
+ Brini X (HISPANIC), + Biga, X (BLACK), 
+ Byun, X (PRE-MATH), + Bein) x (TWO-PARENT) , 


[10.59] 


+ Bijay * (SEX), 


在 层 -2， 我 们 将 各 个 截 距 模型 设置 为 学 校 类 别 的 函数 ， 学 校 类 别 标识 包 
括 天 主教 学 校 (CATHOLIC) 和 其 他 私立 学 校 (OTHER PRIVATE) ， 以 公立 学 
校 作为 参照 类 。 即 使 在 控制 了 学 校 类 别 以 后 ， 我 们 也 容许 这 些 截 距 继 续 随机 变 
化 。 为 了 简洁 起 见 ， 在 这 个 初步 分 析 中 我 们 将 其 他 层 - 1 回归 系数 限制 为 固定 
参数 。 于 是 ， 我 们 有 : 


Baiar = Yoorm + Youn * (CATHOLIC); 
+ Yoon) X (OTHER PRIVATE), + Yorn) [10.60] 


Baai = 


表 10.7 中 的 结果 说 明 ， 协 变量 与 进入 四 年 制 学 院 (“ 第 一 类 " ) 相对 于 不 
升学 的 对 数 发 生 比 之 间 的 联系 ， 总 的 来 说 ， 大 于 协 变量 与 进入 两 年 制 学 院 
(“第 二 类 ") 相对 于 不 升学 的 对 数 发 生 比 之 间 的 联系 。 导 臻 进入 四 年 制 学 院 发 
生 比 提高 的 层 - 1 效应 包括 : 较 高 的 八 年 级 数学 成 绩 、 较 高 的 社会 经 济 状况 、 
家 中 父母 双全 、 女 学 生 以 及 亚 裔 学 生 和 黑人 学 生 (相对 于 白人 学 生 ) 。 在 预测 
进入 两 年 制 学 院 的 发 生 比 (相对 于 不 升学 ) 时 ， 其 他 对 应 系数 都 较 小 ， 只 有 


O W: 原 书 此 数 如 此 ! 表 10.7 中 相应 数 为 0. 039。 
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八 年 级 数学 成 绩 和 社会 经 济 状况 的 系数 统计 性 显著 。 当 然 ， 这 些 结果 都 是 在 控 
制 所 有 其 他 协 变量 包括 学 校 类 别 以 后 的 净 效 应 。 

青 来 看 层 -2 的 情况 。 在 控制 了 学 生 的 背景 变量 以 后 ， 天 主教 学 校 和 其 他 
私立 学 校 的 学 生 比 公立 学 校 的 学 生 进 入 四 年 制 学 院 的 对 数 发 生 比 更 高 。 可 是 ， 
在 预测 进入 两 年 制 学 院 时 的 情况 却 不 是 这 样 ， 这 时 与 天 主教 学 校 和 其 他 私立 学 
校 相 联系 的 点 估计 实际 上 为 负 值 ， 但 它们 不 具有 统计 显著 性 。 

学 校 类 别 在 解释 进入 四 年 制 学 院 的 发 生 比 和 进入 两 年 制 学 院 的 发 生 比 之 间 
的 不 同 可 以 推翻 应 用 序 次 回归 模型 的 结论 ， 因 为 序 次 回归 要 基于 发 生 比 成 比例 
的 假定 。 这 一 假定 意味 着 ， 一 个 解释 变量 应 该 与 每 一 个 序 次 的 累计 发 生 比 有 同 
样 的 联系 。 与 此 相反 ， 我 们 的 多 项 模型 分 析 结 果 却 表明 ， 尽 管 私立 学 校 的 学 生 
比 公 立 学 校 的 学 生 更 有 可 能 进入 四 年 制 学 院 ， 但 他 们 进入 两 年 制 学 院 的 可 能 性 
却 并 不 比 公 立 字 校 的 学 生 更 大 。 其 实 ， 他 们 进入 两 年 制 学 院 的 可 能 性 甚至 更 
小 ， 只 不 过 所 估计 的 负 的 系数 并 没有 取得 统计 显著 性 。 

不 同方 程 之 间 的 系数 比较 。 比 较 不 同方 程 中 的 对 应 系数 经 常 很 有 用 。 比 
如 ， 天 主教 学 校 的 学 生 和 公立 学 校 的 学 生 进入 四 年 制 学 院 (相对 于 不 升学 ) 
的 相对 发 生 比 。 这 可 以 由 下 列 公式 表达 : 


Prob(R = 1|Catholic)/Prob(R = 3| Catholic) [10.61] 


Prob(R = 1| public)/Prob(R = 3| public) 


eD = 





类 似 地， 天 主教 学 校 的 学 生 和 公立 学 校 的 学 生 进 入 两 年 制 学 院 的 相对 发 生 比 可 
由 下 列 公 式 表 达 : 


Prob( R = 2| Catholic) /Prob( R = 3! Catholic) [10.62] 
Prob( R = 2| public)/Prob(R = 3| public) are 


enn 





因此 ， 还 可 以 比较 天 主教 学 校 的 学 生 和 公立 学 校 的 学 生 进入 四 年 制 学 院 与 进入 
两 年 制 学 院 的 相对 发 生 比 ， 公 式 为 ; 


Prob{ R = 1|Catholic)/Prob(R = 2|Catholic) [10.63] 
Prob( R = 1| public)/Prob( R = 2| public) j 


emo) = 


应 用 分 层 模型 软件 中 的 多 元 假设 检验 功能 ， 我 们 便 可 以 检验 天 主教 学 校 的 
学 生 是 否 比 公立 学 校 的 学 生 有 更 大 的 可 能 进入 四 年 制 学 院 (相对 于 两 年 抽 
学 院 ) ARH fon - yat = 1-714, By? =11.78,p=0.001。 就 
进入 四 年 制 学 院 的 发 生 比 相对 于 进入 两 年 制 学 院 的 发 生 比 而 言 ， 天 主教 学 
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校 的 学 生 要 高 于 公立 学 校 的 学 生 。 相 对 发 生 比 为 exp(1.714) =5.55， 这 
是 一 个 很 大 的 效应 。 


在 分 层 一 般 化 线性 模型 中 的 估计 工作 考虑 


本 章 的 首要 日 的 是 对 离散 型 层 -1 结果 的 多 层 模 型 提供 直观 性 和 概念 性 的 
介绍 ， 因 为 这 类 模型 比 以 前 介绍 的 连续 结果 模型 要 复杂 得 多 ， 所 以 我 们 将 估计 
工作 的 介绍 推迟 到 本 章 的 结尾 ， 

当 层 -1 结果 为 离散 型 时 ， 层 -上 抽样 模型 就 不 是 正 态 分 布 ， 然 而 更 高 层 
的 模型 涉及 多 元 正 态 假定 ， 这 便 给 传统 估计 理论 造成 了 问题 ， 第 3 章 所 描述 的 
方法 不 再 适用 。 分 层 一 般 化 线性 模型 的 参数 估计 变 得 更 为 复杂 ， 涉 及 最 大 似 然 
的 近似 计算 。 最 常用 的 方法 是 根据 一 阶 或 二 阶 泰勒 级 数 展 开 式 对 模型 中 的 固定 
系数 和 随机 系数 做 近似 估计 ， 这 被 称 为 补偿 性 准 似 然 估 计 (penalized quasi- 
likelihood estimation，PQL) ， 曾 经 由 Breslow 和 Clayton (1993) 以 及 Goldstein 
(1991) 做 过 描述 。 喝 精确 的 方法 是 根据 高 斯 - ROK AF LGD ( Hedeker & Gib- 
bons, 1994; Pinheiro & Bates, 1995) 或 拉 普 拉 斯 近似 计算 (Raudenbush， 
Yang, & Yusef, 2000)， 这 些 方面 也 得 到 了 发 展 。 对 分 层 一 般 化 线性 模型 的 估 
计 和 计算 方法 将 在 第 14 章 详细 讨论 。 


本 章 术 语 概 要 


一 般 化 线性 模型 : 一 种 先 将 期 望 结 果 进 行 转换 ， 然 后 使 这 种 转换 变量 作为 
回归 系数 的 线性 函数 的 回归 模型 。 对 期 望 结 果 的 转换 方程 被 称 为 连接 函数 ， 而 
后 者 则 被 称 为 结构 模型 。 抽 样 模型 需要 根据 所 研究 的 结果 变量 的 类 型 来 进行 选 
择 。 这 种 方法 适合 于 许多 类 型 的 数据 (BK 10.8) ， 包 括 连 续 型 结果 、 分 类 
型 结果 以 及 计数 数据 。 

分 层 一 般 化 线性 模型 ; 一 般 化 线性 模型 可 以 扩展 到 包括 多 个 层次 嵌 套 的 场 
合 。 标 准 一 般 化 线性 模型 便 成 为 其 中 的 层 -1 模型 。 

层 -1 期 望 值 : 在 保持 层 - 1 模型 中 所 有 随机 系数 不 变 时 的 层 - 1 结果 的 
期 望 值 。 

层 -1 抽样 模型 : 在 保持 层 -1 期 望 值 不 变 的 条 件 下 ， 层 - 1 结果 被 假设 
为 从 某 种 概率 分 布 中 产生 。 这 种 层 -1 概率 分 布 被 称 为 层 - 1 抽样 模型 。 
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层 ~1 连接 函数 : 对 层 -1 结果 的 期 望 值 进 行 转换 ， 令 其 转换 结果 ,等 于 回 
归 系 数 的 线性 函数 。 这 种 转换 被 称 为 层 - 1 连接 函数 (参见 表 10.8 中 的 mp) 。 


R108 两 层 一 般 化 线性 模型 的 例子 





结 虹 的 类 型 层 -1 抽样 模型 县 -1 WAR 层 -1 连接 函数 
连续 型 正 态 分 布 my 
-œ << { Normal) a { 恒 等 ) 
-项 型 DEA DE ny = log[ ps/{1 - ey) ] 
Y, € 10,1! (Bemoulli) * (logit) 
计数 型 二 项 分 布 five ny = logl po/(1 - @4)) 
Yy e 10,1, my} ( Binomial) * (logit) 
计数 型 Baa à ny = lol Ay) 
Yy @ 101, ( Poisson) A (对 数 ) 
序 次 多 类 多 项 分 布 P ag = [gs/(1 - pay) ] 
Ry e (12,0 ,M} ( Multinomial) "a (Rit logit) 
名 义 多 类 多 项 分 布 Day = [poy/ (Puy) J 
Ry € {1,2,- M1 ( Multinomial) * (多 项 logit) 


层 -1 结构 模型 : 令 层 - 1 连接 函数 ,与 一 个 具有 层 - 1 系数 的 线性 模型 
相等 。 这 个 线性 模型 就 是 层 -1 结构 模型 。 

过 离散 与 欠 离 散 : 层 -1 结果 的 变异 性 可 能 大 于 根据 层 - 1 抽样 模型 所 期 
望 的 水 平 ， 这 被 称 为 过 离散 。 欠 离散 指 层 - 1 结果 的 变异 性 小 于 根据 层 -1 抽 
样 模型 所 期 望 的 水 平 。 

具体 单位 模型 : 具体 单位 模型 所 定义 的 固定 回归 系数 可 以 被 解释 为 ， 在 控 
制 模型 中 其 他 自 变量 和 所 有 随机 效应 不 变 时 ， 某 一 有 关 自 变量 增加 一 个 单位 量 
导致 结果 上 的 期 望 变化 量 。 

总 体 平均 模型 : 与 具体 单位 模型 相反 ， 总 体 平均 模型 所 定义 的 回归 系数 可 
以 被 解释 为 ， 在 控制 模型 中 其 他 自 变量 不 变 但 并 不 控制 任何 随机 效应 时 ， 某 一 
有 关 自 变量 增加 一 个 单位 量 导 致 结果 上 的 期 望 变化 量 。 
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潜在 变量 的 分 层 模 型 


© 有 缺失 数据 的 回归 

© 自 变 量 有 测量 误差 的 回归 

© 有 缺失 数据 和 测量 误差 的 回归 
e 潜在 变 亚 直接 和 间接 效应 的 估计 
© 非 线 性 分 项 反应 模型 

e 本 章 术 语 概要 


传统 的 统计 学 模型 表述 了 一 组 可 测 变量 的 相互 关系 ， 这 些 关 系 用 相应 的 未 
知 总 体 参数 表征 (如 回归 系数 、 相 关系 数 、 事 件 发 生 比 率 、 均 值 差 ) 。 不 过 ， 
人 们 常常 会 关注 潜在 变量 (latent variable) ， 即 不 能 直接 测量 的 变量 。 例 如 ， 儿 
童 的 攻击 性 程度 不 容易 直接 测量 ， 但 是 可 以 通过 向 老师 询问 一 系列 的 问题 ， 从 
回答 中 间接 进行 推断 。 为 减轻 攻击 性 设计 的 实验 性 干预 不 是 主要 针对 某 项 特定 
指标 或 测量 攻击 性 的 实验 量 表 ， 而 是 针对 导致 这 些 指标 变化 的 潜在 攻击 性 。 因 
此 ， 实 验 研 究 的 目的 在 于 评价 实验 干预 和 一 个 潜在 变量 之 间 的 关联 ， 不 过 这 些 
关联 是 由 可 测 的 、 难 免 带 有 误差 的 数据 间接 推断 的 。 这 种 思维 逻辑 提出 了 两 阶 
段 推断 问题 : 必须 先 考虑 潜在 变量 如 何 产生 了 有 误差 的 数据 ， 然 后 才能 推断 产 
生 潜在 变量 的 总 体 参 数 (Bock， 1989) 。 本 章 研 究 如 何在 分 层 模型 的 框架 下 处 
理 这 种 两 阶段 推断 问题 。 

不 仅 是 指标 的 测量 误差 ， 而 且 缺 失 数据 也 掩盖 了 潜在 变量 之 间 的 关联 。 例 
如 ， 若 在 总 体 中 随机 抽取 ”个 调查 对 象 ， 然 后 从 每 个 调查 对 象 那里 收集 P 个 变 
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量 的 数据 。 然 而 ， 一 个 或 几 个 人 的 一 个 或 儿 个 变量 可 能 缺失 。 调 查 目 的 不 会 因 
数据 缺失 而 改变 ， 仍 然 是 从 代表 总 体 的 = 例 样 本 来 推断 目标 总 体 。 有 缺失 值 的 
变量 可 以 被 视 为 潜在 变量 。 

从 某 种 意义 上 来 说 ， 潜 在 变量 分 析 总 可 以 视 为 数据 缺失 问题 。 我 们 可 以 把 
观测 数据 视 为 残缺 数据 ， 把 完整 数据 视 为 残缺 数据 加 上 缺失 数据 (Little & Ru- 
bin，1987) 。 我 们 的 研究 目的 是 应 用 残缺 数据 对 生成 完整 数据 的 参数 进行 有 效 
的 推断 。 

事实 上 ， 本 书 通 篇 都 可 以 被 视 为 在 解决 潜在 变量 问题 。 例 如 在 第 4 章 中 
我 们 考虑 的 是 很 多 中 学 中 的 每 个 学 校 的 社会 经 济 状况 与 成 绩 的 斜率 。 这 一 斜率 
是 潜在 的 或 不 可 观测 的 变量 。 我 们 的 目的 是 推断 在 学 校 总 体 中 这 些 斜 率 的 分 
布 。 于 是 ， 我 们 用 一 个 层 - 1 模型 将 每 个 学 生 的 观测 数学 成 绩 表达 成 潜在 变节 
(学 校 的 均值 和 斜率) 的 函数 。 层 -2 模型 表述 这 两 个 潜在 变量 在 学 校 总 体 中 
的 分 布 。 与 此 类 似 ， 第 6 章 讨 论 了 儿童 在 2 岁 那 年 词汇 量 增长 的 模型 ( Hutte- 
nlocher et al. ，1991) ， 用 层 -1 模型 将 不 同时 点 观测 的 每 个 儿童 的 词汇 量 表 达 
为 几 个 潜在 增长 参数 的 函数 ， 并 发 现 关键 的 增长 参数 就 是 加 速率 。 层 -2 模型 
描述 了 儿童 总 体 的 潜在 加 速 分 布 。 我 们 利用 观测 数据 (词汇 量 和 年 龄 ) 推断 
潜在 变量 (加 速率 ) 的 总 体 分 布 。 

熟悉 结构 方程 模型 (SEM) 的 读者 立即 会 发 现 这 些 两 层 模型 与 LIS- 
REL ( Joreskog & Sorbom, 1996) EQS (Bentler, 1983), AMOS ( Arbuckle, 
1994) | M-plus (Muthén & Muthén, 1998) 等 软件 估计 的 模型 可 以 说 是 殊 
途 同 归 。 首 先 ， 结 构 方 程 模型 分 析 采 用 测量 模型 来 描述 有 潜在 变量 作用 下 
的 观测 数据 分 布 ， 然 后 采用 结构 模型 描述 了 潜在 变量 之 间 的 关联 。Willett 
和 Sayer (1994) 澄清 了 在 个 体 变化 模型 情况 下 分 层 线性 模型 和 结构 方程 模 
型 之 间 的 关系 。 

由 于 事实 上 分 层 模 型 可 被 明确 视 为 潜在 变量 模型 ， 所 以 分 层 线性 模型 当然 
可 以 用 于 解决 缺失 数据 和 测量 误差 引起 的 很 多 问题 。 本 章 主 要 关注 的 就 是 这 两 
个 方面 。 


有 缺失 数据 的 回归 


HARTA HEE X, X, o, X。,， 要 应 用 多 元 线性 回归 解释 结果 
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变量 Z 的 变化 。 假 定 模型 误差 为 独立 正 态 分 布 ， 应 用 常规 最 小 二 乘法 的 标 
准 估 计 会 产生 PP 个 回归 系数 ( 截 距 和 PP-1 个 斜率 ) 的 有 效 估计 和 残 差 方 
差 ， 以 及 标准 的 4 检验 或 检验。 不 过 ， 如 果 任 何 一 个 分 析 单 位 有 Y 值 缺 
KREA XMR, 常规 最 小 二 乘法 公式 就 不 能 得 到 评价 。 若 要 应 用 常规 
最 小 二 乘法 ， 必 须 或 者 舍 奔 有 缺失 值 的 案例 ， 或 者 应 用 诸如 配对 缺失 数据 
程序 等 手段 填补 那些 案例 的 缺失 值 。 这 些 方法 都 会 对 统计 推断 造成 一 定 的 
风险 (Little, 1992) . 

BR AR RHE RR EE EAL, HER EA SS BD TEA A Od 
差 。 如 此 放弃 数据 还 会 导致 精度 变 差 。 如 打 填 补 方法 是 经 过 认真 推荐 的 ， 
填补 缺失 值 的 方法 比较 好 些 。 不 过 标准 误 估计 会 有 负 偏 差 ， 配 对 删除 会 导 
致 严重 的 估算 错误 ，Little (1992) 和 Schafer (1997) 曾经 详细 回顾 了 这 些 
问题 。 


基于 多 元 模型 填补 缺失 数据 


应 用 多 元 模型 式 填补 方法 能 够 令 人 满意 地 解决 数据 缺失 问题 (Little & Ru- 
bin, 1987; Schafer, 1997)。 多 元 填补 方法 生成 MH 套 “ 完 整 ” 的 数据 集 。 用 常 
规 最 小 二 乘法 分 析 每 套数 据 ， 对 结果 取 平 均 得 到 每 个 回归 系数 的 点 估计 。M 个 
抽样 方差 的 均值 加 上 一 个 表达 1 个 点 估计 之 间 变 异 的 膨胀 系数 ， 便 得 到 适当 
的 抽样 方差 。Little 和 Rubin (1987 ) Little 和 Schenker (1995) 以 及 Schafer 
(1997) 都 发 表 过 这 些 标准 误 的 计算 公式 。 

除了 产生 逼真 的 标准 误 以 外 ， 只 要 满足 模型 假定 且 数 据 为 “随机 缺失 ” 
(missing at random ， 简 标 为 MAR) ， 多 元 模型 式 填 补 方法 还 可 得 出 关于 产生 完 
整数 据 的 参数 的 无 偏 推断 。 随 机 缺失 是 比较 宽松 的 条 件 ， 远 非 “ 完 全 随机 缺 
失 ” (missing completely at random, (RRA MCAR) 那样 严格 。 完 全 随机 缺失 
假定 缺失 数据 是 完整 数据 的 一 个 简单 随机 样本 。 而 随机 缺失 则 不 同 ， 只 假定 在 
所 有 观测 数据 不 变 的 情况 下 ， 缺 失 的 概率 与 完整 数据 的 取 值 无 关 。 这 一 假设 往 
往 成 立 ， 因 为 实际 数据 集 当 中 的 变量 通常 既 包 含 缺失 数据 的 大 量 信息 ， 也 包含 
关于 某 数据 点 缺失 概率 的 大 量 信息 。 此 外 ， 即 使 随机 缺失 不 成 立 ， 只 要 缺失 信 
息 的 比例 很 小 ， 多 元 模型 式 填补 方法 得 到 的 结果 仍然 稳健 。 应 当 注 意 缺 失信 息 
的 比例 并 不 等 于 缺失 数据 点 的 比例 ， 而 是 与 给 定数 据 条 件 下 缺失 数据 中 未 解释 
的 变异 有 关 。 如 果 研 究 变量 之 间 关 系 密切 ， 即 使 缺失 案例 的 比例 很 大 ， 缺 失信 
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息 比 例 也 可 能 很 小 。 前 而 提 到 的 其 他 方法 (舍弃 整个 缺失 案例 、 填 补 单独 的 
缺失 值 、 配 对 删除 ) 都 不 能 在 随机 缺失 条 件 下 得 到 无 偏 估计 ， 一 般 其 结果 对 
于 非 随机 缺失 问题 也 并 不 稳健 。 


分 层 线性 模型 应 用 于 缺失 数据 的 问题 


多 元 模型 式 填补 方法 中 关键 的 步骤 是 仅 根 据 已 有 数据 有 效 地 估计 完全 数据 
ff] P ICH Dempster, Laird 和 Rubin (1977) 在 他 们 富有 启发 性 的 文章 中 展 
示 了 如 何 运 用 EM (expectation maximization， 期 望 最 大 化 ) 算法 根据 残缺 数据 
计算 己 元 正 态 分 布 的 最 大 似 然 估 计 .T (与 此 相似 的 方法 可 见 Orchard & Wood- 
bury, 1972; Goldstein, 1995, 第 4 章 ,) 

遗 盎 的 是 ， 多 元 填补 程序 比较 麻烦 ， 需 要 多 元 分 析 和 结果 综合 。 用 较为 简 
单 的 方法 在 给 定 残 缺 数据 情况 下 对 完整 数据 P 元 分 布 的 最 大 似 然 估 计 ， 也 可 发 
挥 满足 随机 缺失 条 件 的 有 效 推断 的 优势 。 这 类 似 于 多 元 填补 程序 的 第 一 步 
(Little, 1992)。 不 过 ， 下 一 步 是 简单 地 将 这 些 估计 转换 为 所 需 的 回归 系数 估计 
及 其 标准 误 ， 而 不 是 生成 填补 数据 。 根 据 最 大 似 然 法 的 恒定 性 质 ， 转 换 结 果 仍 
为 最 大 似 然 估计 。 

最 好 用 一 个 简单 的 实例 演示 这 种 方法 。@ 见 表 11. 1 中 的 虚拟 数据 ， 其 中 有 
结果 变量 Z 和 两 个 预测 变量 X MAX, FRP=3, 4A J=15 名 调查 对 象 ， 没 
有 缺失 值 。 应 用 常规 最 小 二 乘法 回归 ， 得 到 三 个 回归 系数 的 估计 值 及 其 标准 
误 ， 列 于 表 11. 1 底部 。 

假设 表 11. 1 中 的 一 些 数 值 不 可 获得 。 表 11.2 为 可 获得 数据 或 “ 残 
缺 ”数据 。 例 如 第 4 例 的 ZX, 有 数值 而 没有 数值 ， 第 3 例 只 有 2 的 
数值 。 

重新 组 织 数据 。 首 先 将 每 个 案例 j 的 变量 均 视 为 “测量 机 会 "。 若 数据 完整 ， 
则 每 例 都 有 P =3 次 观测 。 若 案例 j 缺 失 了 一 个 数值 ， 该 例 的 机 会 只 有 2 次 ; 
车 j 缺 失 2 个 值 ， 则 该 例 只 有 一 次 机 会 。 然 后 结果 被 重新 理解 为 Y,, BUS fy 


Diet ASP AS, CE ae I A YS AE Te EAS A HW OY k fE 
布 ， 多 元 填补 便 是 从 该 条 件 分 布 中 抽样 的 。 

D ”本 章 介绍 的 方法 最 天 于 中 等 或 大 样本 数据 。 不 过 ， 为 了 能 解释 清楚 ， 我 们 用 小 样本 数据 作为 例 
f 
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R11 回归 分 析 用 的 虚拟 数据 : ZAR, X, MX, 为 预测 变量 





完整 数据 

案 例 F4 A X: 
i 7 = E 48.92 41.86 E 60. 41 
2 55. 54 56. 06 52.99 
3 59,49 39.65 53. 38 
4 46, 52 37.31 55.25 
5 56. 20 57. 59 52. 54 
6 50.40 58. 75 47.94 
7 51.55 42.34 51.42 
8 75.41 58.95 69. 87 
9 36, 13 45.74 44.62 
10 43. 88 51. 54 44. 04 
n 68. OL 62. 26 48.52 
12 56, 65 62.11 48. 90 
13 40. 49 47.21 55.69 
14 35. 52 39.75 39. 45 
15 60. 48 64.43 66. 00 

回归 结果 
AER 系 数 标准 误 se 

E Rë a = 13.093 — 15. 542 

x, 0. 562 0. 220 

x, 0. 697 0. 259 


在 第 i 次 机 会 收集 的 数据 ， 其 中 i=1，…, n, An <P =3, WR; BEE 
整 ， 则 7; =2;,, Yy =X, Vy =Xyo #13 为 重新 组 织 后 的 完整 数据 ， 表 
11.4 则 为 相应 的 残缺 数据 。 注 意 新 生成 的 虚拟 变量 Da, Dy, Dy RR 7, 是 Z, 
Xo RE Xy 例如 表 11.4 中 第 4 个 案例 ，X,, 为 缺失 ， 于 是 有 Y,, = Z, = 
46.52, Yu =X, =55.25。 这 些 由 第 一 条 记录 的 D, 取 值 为 1、 第 二 条 记录 的 D， 
取 值 为 | 来 表示 。 
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囊 11.2 回归 分 析 用 的 虚拟 数据 : Z 为 结果 ，XX, 和 X 为 预测 变量 








残缺 数据 

案 例 2 x, x, 
~ 1 48. 92 = 41. 86 ~ 60. 41 
2 ? 56. 06 52.99 

3 59.49 , z 
4 46.52 ? 55.25 

5 56. 20 57.59 ? 
6 50. 40 58.75 47.94 
7 51.55 ? 51.42 
8 75.41 $8. 95 69, 87 
9 36.13 45.74 44.62 
10 43. 88 $1.54 44.04 
11 68.01 62.26 48. 52 
12 56. 65 62.11 48.90 
13 40. 49 47.21 55.69 
14 35. 52 39.75 39, 45 
15 60. 48 64, 43 66. 00 








案例 Y D; D, D, 
1 48. 92 1 0 E 0 
1 41, 86 0 1 
1 60.41 0 0 1 
2 55. 54 1 0 0 
2 56. 06 0 1 0 
2 52.99 0 0 1 
3 59.49 1 0 0 
3 39. 65 0 1 0 
3 53.38 o 0 1 
4 46. 52 1 0 0 
4 37.31 0 1 0 
4 55. 25 0 0 1 
5 56. 20 1 0 0 
5 57. 59 0 1 0 
5 52.54 0 1 
6 50. 40 1 0 0 
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续 表 11.3 
案 例 了 D; D, D, 
— J 5 J 0 g 1 f 0 
6 47.94 0 0 1 
7 51. 58 1 0 0 
7 42.34 a 1 0 
7 $1.42 0 0 1 
8 75.41 1 0 0 
8 58.95 0 1 0 
8 69. 87 0 0 1 
9 36.13 1 0 0 
9 45.74 0 1 0 
9 44.62 0 0 1 
10 43. 88 1 0 0 
10 51. 54 0 1 0 
10 44. 04 0 0 1 
il 68.01 1 0 0 
11 62.26 0 1 0 
11 48. 52 0 0 1 
12 56.65 1 0 0 
12 62.11 0 1 0 
12 48.90 0 0 1 
13 40.49 1 0 0 
13 47.21 0 1 0 
13 55.69 0 0 1 
14 35.52 1 0 0 
14 39.75 0 1 0 
14 39. 45 0 0 1 
15 60. 48 1 0 0 
15 64.43 0 1 0 
15 66. 00 0 0 1 
最 大 似 然 估计 
st 系数 标准 误 ze 
y: 52. 346 2.786 
Yı 51.037 2.372 
Yı 52.734 2. 021 
Ta Ta Ta 116. 433 59. 673 52.558 42.515 29, 880 25.687 
Th TT 84.435 17. 525 30. 831 19. 116 


Tn 61. 280 22. 376 
一 
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表 11.4 转换 后 的 残缺 数据 


D, 





oo- 


cs 


os coor cos oo oc 


> o 
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续 表 11.4 
案 例 + D; a 
6 ws 1 0 
15 64.43 0 1 
15 66. 00 0 0 
最 大 仆 然 估计 
参数 系数 标准 误 se 
ma 52.256 2. 836 
Y: 53. 828 2.081 
7 53.052 2.221 
Tu Ta Ta 118.204 62.598 54,445 43,913 27.952 28.143 
fii Tb 58.789 20.014 23.171 18.425 
Tn 67.676 26. 269 


层 -1 模型 。 第 一 层 的 单位 为 测量 机 会 ， 第 一 层 的 单位 为 个 人 。 层 -1 模 


型 简单 地 表示 哪个 完整 数据 元 素 得 到 观测 : 


Y, = DyZ, + DX, + Dy;Xy 


于 是 ， 对 案例 1， 有 : 

Y,, = (1) x Z, + (0) xX, + (0) xX, = Y, = 48.92 
Yn = (0) xZ, + (1) xX, + (0) x =X, = 41.86 
Ya = (0) xZ, + (0) xX, + (1) x Xu = X,, = 60.41 


或 以 矩阵 表示 为 : 


再 看 案例 4 的 残缺 数据 (R114), A: 


=(1)xZt+(0) xX, + (0) x X,, =Z, = 46.52 
Ya = (0) x Z, + (0) xX, + (1) xX, =X, = 55.25 


[11.1] 


(11.2) 


[11.3] 


[11.4] 
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或 以 矩阵 表示 为 : 
Y £ 2 
a ft 0 0 _ 46.5 
(z F p 0 {=} — pea) 
Xu 
通常 可 将 矩阵 方程 写 为 : 
Y, = DY; [11.6] 
其 中 ，Y, 是 观测 数值 的 n 维 向 量 ，Y， 尾 完整 数值 的 向 量 ，D, 是 虚拟 变量 短 
阵 ， 表 示 已 获得 完整 数据 的 元 素 。 注 意 ， 在 原则 上 ， 每 个 案例 j 都 存在 一 个 
Yi” 。 这 些 完整 数据 成 为 层 -2 模型 中 的 结果 。 


层 -2 模型 。 层 -1 模型 将 残缺 数据 表示 为 完整 潜在 数据 的 函数 ， 同 时 层 
-2 模型 描述 了 完整 数据 的 分 布 : 


2 = y+u, 
Xy = y+ 
Xy = Yi + uy 


(11.7) 
uy, 0 fa Tx To 

| | | Fu. Ti “| 

uy 07 \ra Tn Tn 

IP, ZX, XY, 中 的 完整 数据 ， 于 是 y,、Yy,、Y; 分 别 为 完整 的 Z、 
Xis X 的 均值 。 该 层 -2 模型 可 用 矩阵 表示 为 : 








y 


=ytu,, u, ~ N(O,T) [11.8) 


由 此 ， 层 -2 模型 描述 了 完整 数据 的 多 元 正 态 分 布 。 
组 合 模型 。 将 层 -2 模型 (方程 11.8) 代 人 层 -1 模型 (方程 11.6) 得 
到 以 矩阵 表示 的 组 合 模型 ; 


Y, = Dy+Du, Du, ~ N(0,D,TD’) [11.9] 
应 用 第 14 章 中 介绍 的 EM 算法 或 Fisher 得 分 算法 不 难 估计 该 模型 。 


结果 : 完整 数据 。 分 层 线性 模型 分 析 从 均值 Cy. yi y) ATO 
差 协 方差 元 素 〈( 表 11. 3 的 底部 ) 的 最 大 似 然 估 计 人 手 。 这 些 估 计 包 括 了 
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计算 所 需 回归 参数 的 所 有 必要 信息 。 根 据 多 元 正 态 分 布 的 标准 理论 ， 我 们 


得 出 : 
Tn J'y- 
E(Z IX pX) = 7, + (ta | | | | [11.10} 


Tn Tn Xy = Y: 


RAR 11.3 底部 的 最 大 似 然 估计 值 ， 得 到 : 


84.435 17.5257" p Xy ~ 51.037 
E(Z,(¥,,.X,,) = 52.346 + (59.673 52. sa| x 


17.525 61.280 X,, -52.735 


= ~ 13.093 + 0.562 x X, + 0.697 x X, [11.11] 


于 是 两 阶段 分 层 线性 模型 分 析 与 常规 最 小 二 乘法 分 析 的 结果 完全 相同 ( 见 表 
11.1 的 底部 ) 。 

结果 : 残缺 数据 。 将 残缺 数据 组 织 为 表 11.4 的 形式 ， 应 用 前 面 介 绍 的 分 
层 线性 模型 分 析 方法 ， 可 得 到 回归 系数 的 最 大 似 然 估计 。 分 层 线性 模型 分 析 仍 
开始 于 均值 (y,、y,、y;) MT 的 方差 协 方差 元 素 ( 见 表 11.4 的 底部 ) 的 最 
大 似 然 估计 。 再 将 最 大 似 然 估 计 值 代入 方程 11. 10， 得 到 : 
58. 789 eof H | 

x 


E(Z,)X,,,X,,) = 52.256 + [62.598 sas] 
20.014 67.676 


= -23.950 + 0.879 x X, + 0.544 x X, [11.12] 


Xy ~ 53.052 


DR Vex Viv Yo 的 最 大 似 然 估 计 的 大 样本 协 方差 矩阵 和 工 可 推算 出 标准 误 ( 详 
W, Raudenbush & Sampson, 1999a) 。 


自 变 量 有 测量 误差 的 回归 


测量 误差 在 多 元 回归 推断 中 造成 的 后 果 已 是 尽 人 箔 知 (参看 Fuller, 
1987)。 如 果 对 结果 变量 测量 有 误差 ， 在 估计 回归 系数 时 不 会 有 偏 ， 但 会 削弱 
精度 和 统计 功效 ， 而 且 会 削弱 预测 变量 的 解释 功效 估计 (R) 与 此 相反 ， 
一 个 或 多 个 预测 变量 的 测量 误差 使 回归 系数 估计 产 生 偏差 。 例 如 ， 如 果 一 个 预 


D 不 过 ， 如 果 将 结 昌 和 解释 变量 都 如 以 标准 化 ， 辐 归 系 数 就 会 是 有 含 估计 。 
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测 变量 有 测量 误差 ， 该 变量 的 系数 估计 会 偏向 0， 因 此 在 估计 方程 中 的 其 他 系 
数 时 ， 该 变量 的 调整 作用 就 会 被 低估 。 

常规 结构 方程 靠 加 入 一 个 测量 模型 来 补充 结构 模型 的 方法 处 理 结果 变量 和 
解释 变量 中 的 测量 误差 。 可 将 结构 方程 视 为 一 个 分 层 模型 : 层 -1 模型 描述 潜 
在 数据 与 有 误差 数据 之 间 的 相关 ， 而 层 -2 模型 描述 潜在 数据 之 间 的 结构 关 
系 。 这 符合 实际 情况 ， 即 某 案 例 中 各 项 测量 误差 不 同 ， 且 各 案例 的 潜在 变量 也 
不 同 。 于 是 ， 层 -1 单位 是 项 ， 层 - 2 的 单位 是 案例 。 在 应 用 标准 回归 的 条 件 
下 ， 层 -1 模型 成 为 测量 模型 ， 层 -2 模型 则 表示 了 潜在 变量 的 分 布 。 这 种 方 
法 的 优点 是 : (1) 该 分 析 同 结构 方程 模型 一 样 ， 可 得 到 对 潜在 变量 回归 模型 
的 有 效 估计 ; (2) 加 入 一 个 缺失 数据 模型 并 不 难 (如 上 节 所 述 ); (3) 可 以 增 
加 反映 坡 套 数据 结构 的 层 ， 如 学 生 嵌 套 于 学 校 ( 见 下 节 ); (4) 对 二 项 数据 、 
计数 数据 或 序 次 数据 项 可 以 结合 测量 模型 。 下 面 我 们 继续 用 标准 多 元 回归 的 例 
子 来 演示 这 些 特 点 。 


在 分 层 模 型 中 纳入 测量 误差 信息 


有 儿 种 方法 可 以 达到 这 个 目的 。 一 种 较 周全 的 方法 是 应 用 分 项 反应 理论 
(item response theory, 简 标 为 IRT) ， 通 过 标 度 (scale) 或 检验 来 研究 各 项 反应 
(Lord, 1980; Wright & Masters, 1982; van der Linden & Hambleton, 1996), # 
可 以 构建 一 个 适当 的 标 度 ， 应 用 分 项 反应 理论 分 析 可 以 为 每 个 案例 计算 出 测量 
标 度 分 数 及 其 标准 误 (例子 见 第 8 章 ) 。 在 其 他 的 应 用 中 ， 测 景 的 可 车 性 可 以 
从 以 往 研 究 结果 了 解 或 从 样本 进行 估计 。 还 有 一 种 方法 是 直接 应 用 分 层 线性 模 
型 来 建立 分 项 反应 模型 ， 这 是 本 章 最 后 要 介绍 的 方法 。 

在 当前 的 例子 中 ， 为 简单 起 见 ， 假 定 每 个 变量 的 测量 可 靠 性 至 少 接近 于 已 
知 。 具 体 地 说 ， 我 们 假设 2 的 测量 可 靠 性 为 0. 855，X HVAT HEHE 0.90, X, 的 
可 靠 性 为 0.70。 对 这 些 情 况 进行 模拟 ， 我 们 将 测量 误差 加 到 完整 数据 ( 表 
11.3) 中 ， 得 到 有 误差 的 数据 ( 见 表 11.5) 。 

层 -1 模型。 将 观测 数据 7 表示 为 “真实 的 ”或 潜在 数据 加 测量 误差 的 
函数 : 

Y; = D (Z, +e) + D(X, +6,) + D(X + ey) [11.13] 


在 此 ， 测 重 误差 的 方差 被 视 为 通过 已 往 分 项 分 析 已 知 。 分 别 对 应 于 可 靠 性 为 
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表 11.5 加 测量 误差 的 完整 数据 


11 
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R115 
E A Y D; D, D, 
13 35.45 f 0 0 
13 48.14 0 1 0 
13 56, 61 0 0 1 
14 29. 70 1 0 0 
14 40, 62 0 1 0 
14 45.20 0 0 
15 63.96 1 0 0 
15 68. 20 0 1 0 
15 61,99 0 0 上 
最 大 似 然 估计 
2. a — 标准 误 se 
Yı 52. 346 2. 990 
Yı 51.037 2. 439 
* 52.735 2. 363 
Ta Ta Ta 113.840 69.370 40.208 48.963 33.439 29.262 
Tu Taz 82. 439 26. 023 32. 571 23. 304 
tT 59, 746 30. 575 
0.85, 0.90, 0.70 的 三 个 变量 的 测量 误差 为 ; 
e, ~ N(0,4. 50") 
e, - N(0,2. 607) [11.14] 
ey ~ N(0,4. 90°) 
一 般 将 矩阵 方程 写 为 : 
Y, = D(Y; +e), e ~ N(0,V,) [11.15] 


其 中 ，Y 是 观测 变量 的 n 维 向 量 ，D, 是 标识 变量 的 n x3 SERRE, Y ”是 潜在 
或 “ 真 ” 值 的 3 维 向 量 ，e; 是 测量 误差 的 3 维 向 量 。 在 此 ，V, 是 3 x3 的 对 角 
和 矩阵， 对 角 线 元 素 分 别 为 4. 50 2.607, 、4. 902 ， 分 别 等 于 每 个 潜在 变量 的 测 
基 误 差 方 差 。 注 意 ， 该 模型 是 灵活 的 ， 允 许 每 个 案例 ) = 1，…, 有 不 同 的 测 
量 精 度 ， 不 过 当前 为 简化 起 见 ， 假 定 所 有 案例 在 某 一 给 定 潜在 变量 的 测量 方差 
是 恒定 的 。D, 同 前 面 提 到 的 一 样 ， 为 虚拟 变量 矩阵 ， 标 志 着 哪些 机 会 观测 到 
了 潜在 变量 。 
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M -2 模型 , 层 -1 模型 将 观测 数据 表示 为 潜在 数据 加 测量 误差 的 函数 ， 
层 -2 模型 则 描述 了 潜在 数据 的 分 布 : 


2 =y +m, 
X,=y tu; 
Xy =Y tu, 


(11. 16] 





i, 0 T. Ty Ta 
| Wy ~N RIR Tn Th 
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FE, ya yo n 分 别 为 Z、X,、, 的 平均 值 。 用 和 矩阵 表示 层 -2 模型 为 ; 








Yo =y+u, u, ~ N(0,T) [11.17] 


因此 层 -2 模型 代表 了 潜在 数据 的 多 元 正 态 分 布 。 
组 合 模型 。 将 层 -2 模型 (方程 11.17) 代入 层 - 1 模型 (方程 11. 15)， 
产生 矩阵 形式 的 组 合 模型 ， 
Y=D(y+u +e) 
D(u +e) ~ N[0,D(T + V,)D’) [11.18} 


应 用 EM 算法 或 Fisher 得 分 算法 (第 14 章 ) 估计 该 模型 并 不 困难 。 还 可 以 直 
接 加 入 其 他 无 测量 误差 的 解释 变量 ， 或 将 结果 变量 重新 设 定 为 多 变量 ,了 
结果 。 分 层 线性 模型 的 分 析 步 又 与 其 对 缺失 数据 的 分 析 几 乎 完全 相同 ， 不 
同 的 只 是 此 处 的 分 析 考虑 了 层 -1 模型 中 的 测量 误差 。 于 是 ， 将 边际 平均 值 及 
其 方差 协 方差 的 最 大 似 然 估 计 进 行 转换 ， 以 求 得 回归 系数 的 估计 。 将 这 些 结果 
与 常规 最 小 二 乘法 分 析 有 误差 数据 的 结果 加 以 比较 很 有 启发 ( 见 表 11.6) 。 我 
们 看 到 ， 常 规 最 小 二 乘法 对 X, 的 贡献 得 出 明显 不 同 的 结果 ( 即 常 规 最 小 二 乘 
法 的 估计 值 为 0. 262， 而 分 层 线 性 模型 分 析 的 相应 值 为 0. 355) 。 本 例 中 的 其 他 
估计 都 相似 ， 因 为 和 2 的 测量 相当 精确 ， 且 和 和 大 之 间 只 有 微弱 相关 。 


中 可 以 用 不 癌 的 方法 做 实际 运算 ， 例 如， 应 用 Raudenbush A (2000) 的 HLMS. O 程序 中 的 加 
权 选 项 ， 对 每 个 结果 计算 权重 Wi = 1/V,， 在 这 个 例子 里 ， 对 Z 就 是 1/4. 50?， 对 和 是 
1/2.60° 3} XB 1/4, 90? ( 对 所 有 六 权重 是 同样 的 ) 。 如 此 定义 权 介 就 要 对 JADER 
重新 加 权 。 这 样 相当 于 定义 一 个 模型 ， 其 中 每 个 加 权 结果 的 层 -1 方差 为 1。 于 是， 在 定义 权 
重 变 量 之 后 ， 用 户 将 屋 -1 VERAI. A-2 模型 保持 不 变 ， 如 方程 11. 20。 





332 ”分 层 线性 模型 ， 应 用 与 数据 分 析 方 法 


请 注意 ， 分 层 线性 模型 分 析 中 所 有 标准 误 都 有 上 升 ， 尤 其 是 较 不 可 靠 的 变量 
X: 系数 的 标准 误 ， 而 它 止 是 不 太 可 靠 的 由 变 量 . 这 些 较 大 的 标准 误 反 映 子 由 
测 第 误差 引起 的 额外 不 确定 性 


表 11.6 考虑 测量 误差 和 不 考虑 测量 误差 的 回归 模型 估计 


SNR LY SP PE BERI SO YW i OS A AL of RR 

系数 系数 
H E ht (se) (se) 

常数 项 re a z 3.61 — — j 25 — — 
(19. 16) (17.49) 
x, 0.729 0.701 
(0. 287) (0. 277} 
Ma 0, 355 0. 262 
(0. 382) (0, 286) 


BS eR BR v MRA ALR AA EPR LAER JS ARR ls MAH d 


有 缺失 数据 和 测量 误差 的 回归 


假设 预测 变量 中 既 含 有 测 最 误差 也 含有 缺失 数据 ， 仍 可 应 几 上 节 所 述 建立 
模型 的 方法 ,不 用 做 任何 修改 。 只 需 把 表 11.5 中 有 缺失 数据 的 行 删 去 ， 应 用 
最 大 似 然 法 估计 边际 平均 值 和 方差 协 方差 元 素 ， 再 经 过 转换 计算 所 需 回归 估计 
及 其 标准 误 。 


潜在 变量 直接 和 间接 效应 的 估计 


社会 科学 研究 一 般 对 已 知 关系 的 中 介 变 量 感 兴趣 。 研 究 者 往往 要 间 : 认 知 
技能 是 否 中 介 影 响 教育 和 职业 状况 之 间 的 关系 (Rivera-Batiz, 1992; Bowles & 
Gintis, 1996)? 学 校 纪律 风气 是 否 中 介 影 响 学 校 的 社会 构成 和 学 生成 绩 之 间 的 
关系 (Lee & Bryk, 1989)? 控制 生育 实践 是 否 中 介 影响 母 亲 教 育 和 生育 率 之 
间 的 关系 (Mason，Wong，& Entwisle, 1984)? 在 这 些 研究 中 普遍 应 用 了 结构 
方程 模型 。 这 些 模型 容许 有 测量 误差 的 解释 变量 和 结果 变量 ， 并 研究 潜在 变量 
之 间 的 关系 ,而 这 些 潜在 变量 可 以 分 别 被 看 作 外 生 解 释 变量 、 中 介 变 量 和 结果 
变量 。 
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对 中 介 作用 的 研究 往往 需要 多 层 数 据 。 在 Lee 和 Bryk (1989) 的 一 项 研 
究 中 ， 社 会 构成 和 学 校 纪律 风气 在 学 校 一 层 变动 ， 然 而 结果 则 在 学 生 层 面 变 
动 . Sampson, Raudenbush 和 Earls (1997) 提出 的 问题 是 , “RRMA” BA 
影响 居民 区 的 社会 构成 和 暴力 事件 之 间 的 相关 ，“ 集 体 效 力 ” 是 指 包 括 凝 聚 
力 、 信 任 、 居 民 维 护 公 共 秩 序 的 干预 能 力 在 内 的 社会 过 程 。 其 中 ， 这 一 关键 的 
构造 指标 是 在 居民 区 层面 变动 ， 但 数据 是 由 居民 区 内 的 多 个 知情 人 提供 的 。 在 
这 些 例子 中 ， 关 键 中 介 变 量 ( 即 学 校 纪律 风气 、 集 体 效 力 ) 是 从 调查 数据 估 
价 而 来 ， 很 可 能 带 有 不 可 忽视 的 测量 误差 。 如 果 和 忽略 了 这 些 测 量 误差 将 会 导致 
对 关键 解释 变量 作用 的 有 偏 估 计 。 

方法 学 家 用 两 种 截然 不 同 的 方法 解决 这 种 涉及 多 层 结构 的 潜在 变量 问题 : 
第 一 种 是 修改 标准 结构 方程 模型 ， 使 之 可 以 结合 多 层 数据 (Lee, 1990; 
Muthén, 1994; McDonald, 1994); 第 二 种 是 先 建立 分 层 模型 ， 然 后 再 引 人 和 人 测量 
误差 模型 ( Raudenbush，Rowan，& Kang, 1991; Longford, 1993; Goldstein, 
1995 ) 。 我 们 遵循 第 二 种 方法 ( 见 Raudenbush & Sampson, 1999a), ， 将 本 章 前 
面 介绍 的 思路 推广 到 多 层 设计 的 情况 。 因 此 ， 模 型 的 第 一 层 仍然 是 建立 观测 数 
据 与 潜在 变量 之 间 的 关系 。 不 过 ， 现 在 潜在 变量 本 身 是 在 两 个 层面 变化 。 通 过 
估计 这 些 潜在 变量 的 联合 分 布 ， 我 们 就 可 以 估计 它们 的 直接 作用 和 间接 作用 。 


一 个 有 测量 误差 和 缺失 数据 的 三 层 示 例 


引发 这 一 示例 分 析 的 问题 是 ， 居 民 区 社会 组 织 的 观测 特征 能 否 对 城市 居民 
区 的 社会 构成 与 该 居民 区 暴力 事件 发 生 水 平 之 间 的 关系 加 以 〈 中 介 性 ) 解释 。 
收集 分 析 数 据 是 1995 年 在 芝 加 如 居民 区 人 类 发 展 项 目 (PHDCN) 的 资助 下 进 
行 的 ， 这 里 报告 的 结果 旨 在 演示 分 析 方 法 ， 而 不 是 提供 结论 性 的 重要 实证 。 
Sampson 、Raudenbush 和 Earls (1997) 在 他 们 的 文章 中 用 更 详尽 的 分 析 得 到 了 
关于 居民 区 社会 组 织 重 要 性 的 更 有 力 的 结论 。 

研究 主要 关注 一 个 5 等 测量 的 “社会 控制 ” 量 表 。 向 居民 提出 的 问题 是 ， 
如 果 发 生 下 列 情况 ， 可 以 指望 邻居 以 各 种 方式 进行 干预 的 可 能 性 。 这 些 情况 包 
括 : (1) 儿童 逃学 并 在 街角 闲逛 ; (2) 儿童 在 当地 建筑 上 喷漆 乱 涂 ; (3) IL 
童 有 不 尊重 成 人 的 表现 ; (4) 在 邻居 住房 前 打架 ; (5) 离 住房 最 近 的 消防 站 
受到 资金 削减 的 威胁 。 回 答 选项 应 用 了 从 1 -5 的 里 氏 量 表 。 大 多 数 调查 对 象 
回答 了 所 有 的 5 个 问题 ， 他 们 的 量 表 得 分 是 5 项 回答 的 平均 值 。 不 过 只 要 至 少 
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回答 了 一 个 问题 也 为 分 析 提 供 了 数据 。 基 于 简单 线性 分 项 反应 模型 ， 考 虑 到 每 
个 居民 回答 项 目的 数量 和 “难度 " ， 可 计算 出 每 个 调查 对 象 的 测量 误差 的 标准 
误 ( 详 出 Raudenbush & Sampson, 1999a) 。 

调查 内 容 还 包括 询问 调查 对 象 关 于 居民 区 内 发 生 暴 力 事件 的 5 个 问题 。 具 
体 是 在 过 去 6 个 月 中 以 下 类 型 的 事件 在 本 居民 区 发 生 的 频繁 程度 : (1) 使 用 
武器 的 斗山 ; (2) 邻居 间 激 烈 的 争吵 ; (3) AK; (4) 性 骚扰 或 强奸 ; 
(5) 抢 动 行凶 。 对 感知 暴力 的 测量 结果 也 反映 了 社会 控制 ， 最 后 得 到 来 自 342 
个 居民 区 (neighborhood clusters, NC) 共 7729 人 的 较 完 整 的 数据 。 

另外 ， 根 据 1990 年 的 普查 结果 独立 地 测量 了 各 居民 区 的 社会 构成 ， 其 中 
包括 贫困 集中 度 (POVERTY CONCENTRATION, ， 即 贫困 线 以 下 的 比例 ) 、 种 族 
隔离 (ETHNIC ISOLATION， 即 非洲 裔 美国 人 的 比例 ) 、 国 外 出 生 者 的 比例 
(FOREIGN BORN) ， 我 们 认为 每 项 指标 都 与 居民 区 的 感知 暴力 正 相关 。 我 们 
假设 社会 构成 与 暴力 之 间 的 关系 至 少 部 分 地 受 居民 区 的 社会 控制 (SOCIAL 
CONTROL) 程度 的 中 介 影 响 。 

表 11.7 描述 了 样本 的 基本 情况 。 从 表 中 可 见 342 个 居民 区 的 平均 黑人 比 
例 为 41.2% ， 且 标准 差 很 大 。 贫 困 线 以 下 和 国外 出 生 者 的 平均 比例 (分 别 约 
为 20% 和 16.5 名 ) 反映 了 芝加哥 的 多 元 化 人 口 构成 。 


R17 样本 基本 情况 描述 











(a) 个 人 层次 数据 
变量 N 均 值 FER 最 小 值 最 大 值 
9. 7729 0.59 0.49 0.00 1.00 
FH 7729 42.59 16.73 17.00 100.00 
社会 经 济 状况 ? 7729 0.00 1.32 4.08 4.33 
(b) 居民 区 层次 数据 
变量 N H A RMR se 最 小 什 最 大 值 
贫 用 集中 更 342 20.43 17.31 0.23 88. 18 
PRAK 342 41.21 43.67 0.00 99.81 
国外 出 生 者 的 比例 342 16. 54 15, 63 0. 00 64, 62 
BH 342 1.88 0.41 1.13 3.17 
社会 控制 342 3.49 0.40 2.38 4.63 


W: a 性 别 编码 为 : 1 = 女 , 0= 男 。 
b. 社会 经 济 状况 SES 为 调查 对 象 的 家 庭 收入 、 受 教育 年 数 、 职 业 状 况 的 第 一 主 成 分 信 
c 此 处 的 双 力 和 社会 控制 为 本 居民 区 的 居民 观测 分 数 的 平均 值 。 
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在 这 项 研究 中 控制 社会 选择 效应 也 很 重要 。 在 一 个 居民 区 中 ， 调 查 对 象 的 
社会 经 济 状况 、 年 龄 、 性 别 等 特征 也 会 影响 其 对 调查 问题 的 回答 。 在 分 析 中 ， 
应 该 从 统计 上 控制 居民 区 内 的 社会 人 口 背 景 与 调查 结果 的 任何 关联 ， 以 便 能 理 
解 不 同居 民 区 之 间 在 结果 上 的 变化 与 协 变 ， 否 则 样本 在 年 龄 、 社 会 经 济 状况 、 
性 别 等 方面 的 构成 不 同 会 造成 对 居民 区 特征 的 测量 偏差 。 表 11.7 描述 了 在 本 例 
分 析 时 使 用 的 个 人 层次 的 协 变量 : 年 龄 ,性别 (1 REK, 0 代表 男 ) ， 社 会 经 
济 状 况 〈 调 查 对 象 的 受 教育 年 数 、 职 业 状 况 、 家 庭 收入 的 第 一 主 成 分 值 ) 。 


模型 


我 们 需要 的 分 析 模 型 要 能 够 : (1) 控制 感知 暴力 和 社会 控制 的 调查 指 
标 上 的 可 变 测量 误差 ; (2) 控制 居民 区 内 与 应 答 相关 的 个 人 特征 ; (3) 恰当 
地 解释 样本 中 的 群 组 特征 ， 即 分 项 反应 嵌 套 于 个 人 ， 而 个 人 又 堪 套 于 居民 
区 中 。 

层 -1 模型 。 层 -1 模型 是 与 感知 暴力 Y, 和 社会 控制 Z, 相 连 的 测量 误差 模 
型 ; 


Ra = Diy (Vy + En) + Dial Zs + bry) (11. 19] 


其 中 : 

sn ~ N(0,oi) 
以 及 

E ~ N(O,o%4) 


方程 11. 19 可 被 看 作 经 典 测量 模型 ， 其 中 R, 是 对 住 在 居民 区 的 个 人 j 的 潜在 
变量 i 的 有 误 测量 。 本 例 中 有 两 个 潜在 变量 ， 即 居民 区 中 的 个 体 j 所 感知 的 
本 区 暴力 “真实 ”水 平 办， 以 及 居民 区 上 中 个 体 7 所 感知 的 本 居民 区 社会 控制 
的 “真实 ”水 平 Zu。 预测 变量 Diw 是 个 标识 变量 ， 若 R 为 感知 暴力 的 测量 ， 
则 取 值 为 1， 否则 为 0;D, 也 与 之 类 似 ， 若 R,, 测 量 的 是 社会 控制 ， 则 取 值 为 
1， 否 则 为 0 (EHA i=l, 2; j=1，…, hi =1，，…， 天 ) 。 不 过 ， 与 常规 分 
层 线性 模型 不 同 ， 这 里 的 层 -1 方差 是 非 齐 性 的 ， 即 各 0 MS oz, 之 间 通 常 不 
相等 。 由 于 对 感知 暴力 和 社会 控制 的 实际 测量 分 项 量 表 可 对 R, 的 测量 标准 误 
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( 即 分 别 为 rw 和 xx) 做 出 很 好 的 估计 ， 我 们 可 以 用 它们 来 对 方程 11. 19 重新 
加 权 ， 因 此 可 消除 非 齐 性 ， 即 如 果 Dsl, H: 


CMa Ry = M6) + bir (11. 20} 
如 果 Dal, WA: 
Ma Ry = Woy oy + Ela 
其 中 : 
su/ ~ N(O,1) 
以 及 
Ba/ Ora ~ N(0,1) 


在 此 我 们 假定 oi 和 03x 分别 等 于 os 和 as- 

还 应 注意 ， 如 本 章 前 面 的 例子 一 样 ， 这 个 公式 可 以 在 分 析 中 利用 所 有 现 有 
数据 ， 而 不 必 删 除 诸如 只 回答 了 社会 控制 问题 但 没有 回答 感知 暴力 问题 的 
案例 。 

层 -2 模型 。 第 二 层 模 型 描述 了 两 个 潜在 变 重 在 居民 区 内 调查 对 象 之 间 的 
变化 : 

Ya = Y, + Bu (AGE); + Bu (GENDER), +B (SES), + rw 
Za = Z, + Bu (AGE), + Ba (GENDER), +B (SES), + ry 


tn 0 n, N. 
("*)-»] (9. (® | 
于 是 居民 区 内 的 潜在 应 答 被 认为 可 能 与 年 龄 ( 岁 ) 、 性 别 (1 = 女 、 
0= 男 ) 和 社会 经 济 状况 SES 相关 。 这 里 ， 年 龄 、 人 性 别 、 社 会 经 济 状况 均 
是 以 总 均值 对 中 的 。 本 分 析 的 中 心 关注 是 ， 对 居民 区 内 与 年 龄 、 性 别 和 社 
会 经 济 状况 有 关 的 可 能 应 答 偏差 做 了 调整 后 ,，“ 真 实 的 ”居民 区 感知 暴力 
均值 Y, 和 社区 控制 均值 Z,。 它 们 的 随机 效应 r,, 和 rs 具有 协 方差 Qp H 
以 表示 在 给 定 方程 11. 21 中 的 Y,、Z, 和 各 BB 值 的 条 件 下 ， 居 民 区 内 多 个 潜 


在 变量 之 间 的 相关 性。 
Fe -3 模型 。 第 三 层 即 最 高 一 层 模型 用 以 描述 居民 区 之 间 在 感知 暴力 调整 


(11.21) 
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均值 和 社会 控制 调整 均值 上 的 变化 ， 


Y, = Y + ya (POV CON), + y,,(ETHNIC ISO), + y,,(%FOR BORN), +u, 
Z, = yo + ya (POV CON), + y, (ETHNIC ISO), + y,,(% FOR BORN), + u, 


eoe] 


(11.22) 


于 是 ， 感 知 暴 力 调 整 均 值 % 和 社会 控制 调整 均值 Z, 都 作为 贫困 集中 度 、 种 族 
隔离 、 国 外 出 生 者 的 比例 的 函数 在 居民 区 之 间 变 化 ， 另 外 再 加 上 一 对 假定 为 二 
元 正 态 分 布 的 随机 效应 (4,;，us) 。 这 些 随机 效应 表示 同一 居民 区 中 调查 对 象 
之 间 的 相关 。 

为 简化 起 见 ， 除 了 调整 均值 之 外 的 所 有 居民 区 内 的 回归 系数 ， 即 所 有 pa 
ABa, =1,2,3，、 都 被 固定 为 常数 ， 用 公式 表达 即 为 : 


Ba => Ba=yw, f=1,2,3 [11.23] 


这 里 要 指出 的 是 ， 模 型 和 估计 步 颈 其 实 可 以 将 随机 变化 加 入 这 些 系 数 。 例 如 ， 
设 居民 区 之 间 年 龄 与 感知 暴力 的 联系 是 随机 变化 的 ， 那 么 调查 对 象 的 年 龄 对 感 
知 反 力作 用 的 模型 可 写 为 ， 


Bay = Ypo + Use [11.24] 


其 中 ，wvw 是 居民 区 上 的 随机 效应 。 因 为 本 例 中 层 -2 模型 的 功能 主要 是 控 
制 个 人 应 答 偏 差 ， 所 以 我 们 决定 将 这 些 系 数 设 为 在 所 有 居民 区 都 相同 的 
常数 。 

结果 。 用 第 14 章 描述 的 最 大 似 然 法 估计 这 个 三 层 模型 ， 结 果 见 表 11.8。 

(1) 控制 应 答 偏差 。 如 表 11. 8 所 示 ， 年 龄 与 关于 暴力 问题 的 回答 有 关 
A (但 性 别 或 社会 经 济 状况 并 不 如 此 )。 在 同一 居民 区 内 ， 老 年 居民 报告 的 
暴力 程度 低 于 较 年 轻 的 居民 ，7yw = -0.521, := -9. 80。 年 龄 和 社会 经 济 状 
况 与 关于 社会 控制 的 回答 相关 (但 性 别 并 不 如 此 ) 。 较 年 长 和 社会 经 济 状况 
较 好 的 调查 对 象 更 倾向 于 认为 邻居 们 会 采取 社会 控制 (Fa =0.306, t= 
4.95; Yoo =2.863，!=3.73)， 这 显示 了 同一 居民 区 内 居民 之 间 的 人 口 特征 
差别 与 他 们 对 居民 区 的 看 法 有 关 ， 在 分 析 居 民 区 之 间 的 有 关联 系 时 控制 了 这 
个 偏差 来 源 。 
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表 11.8 感知 暴力 和 社会 控制 作为 居民 区 杜 会 构成 的 函数 ” 























感知 权力 
间 定 效应 系数 标准 误 se + 比率 
— — — 
层 -2 ee 
ER., Yao -0.521 0.053 -9.80 
B, Y, 0. 880 1. 734 0.51 
社会 经 济 状况 ，y,w 1.024 0.725 1.41 
层 -3 页 测 变量 
贫困 集中 度 ， 7。 1.285 0. 105 12.21 
HRAN, yn 0. 352 0. 060 5.87 
国外 出 生 者 的 比例 ，yyw 0. 636 0. 147 4.34 
社会 控制 
FA SE A ig 系数 标准 误 se + 比率 
RE, yo — 
层 -2 预测 变量 
EM, Yao 0. 306 0. 062 4.95 
EA. Ya 0. 481 2.051 0, 23 
社会 经 济 状况 ，yao 2. 863 0. 849 3.73 
层 -3 Ree 
贫 采 集中 度 ，yw -0.912 0. 108 -8.47 
HEAR, ya -0. 462 0. 062 -7.49 
国外 出 生 者 的 比例 ，yo -1.246 0.151 -8.24 
LEUZE i 
居民 区 内 
感知 暴力 3925 
社会 控制 [G3 5829 
居民 区 间 
Bae B 443 
社会 控制 ‘Ss 375 


注 : a 在 本 表 和 其 他 表 中 ， 方 其 前 条 10000 LAR ME SA AAR, LR RE, 


(2) 居民 区 社会 构成 对 了 的 总 影响 。 如 假设 的 一 样 ， 与 感知 暴力 正 相关 的 
有 居民 区 的 贫困 集中 度 (f, = 1.285, t= 12.21) 、 种 族 隔 离 (7。= 0.352， 
t=5.87) 以 及 国外 出 生 者 的 比例 (7, =0.636, t=4.34 )。 

(3) 居民 区 社会 构成 与 2 的 联系 。 与 上 面 正好 相反 ， 居 民 区 的 贫困 集中 度 
(Ya = -0.912, t= -8.47) 、 种 族 隔离 (fa = -0.462, t= -7.49) 以 及 国外 出 
生 者 的 比例 (ys = -1.246, t= -8.24) 与 社会 控制 之 间 的 联系 都 是 反 向 的 。 
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(4) 转换 分 层 模型 估计 以 估计 直接 和 间接 作用 。 将 方程 11. 22 进行 转换 ， 
EEX (Yi, ZX) 的 分 布 以 估计 (Y lZ, Xa) Wa (HEP XB s = 1, 
2，3， 分 别 对 应 贫困 集中 度 、 种 族 隔离 、 国 外 出 生 者 的 比例 ) 。 新 模型 为 ， 

Y, = Ya, + Yn, (POV CON)，+y。,(ETHNIC ISO), 
+ y .(%FOR BORN), + y,.,Z, +4, (11.25) 


un N(0,r°) 


请 注意 ， 曾 是 方程 11. 22 中 两 个 结果 变量 之 一 的 潜在 社会 控制 变量 Z,， 现 在 
成 为 方程 11. 25 右 侧 的 潜在 预测 变量 了 。 值 得 注意 的 不 仅 是 该 变量 与 感知 暴力 
之 间 的 联系 ， 还 有 居民 区 社会 构成 (那些 自 变量 X) 对 了 的 直接 作用 ， 以 及 居 
民 区 社会 构成 经 过 社会 控制 Z 中 介 的 对 了 的 间接 作用 。 

(5) HE XREF Z 和 了 之 间 的 联系 。 表 11.9 中 明确 显示 了 社会 控制 和 
感知 暴力 之 间 的 反 向 联系 ， 有 yn. = -0.546, t= -5.55， 表现 出 社会 构成 
(贫困 集中 度 、 种 族 隔离 、 国 外 出 生 者 的 比例 ) 的 间接 贡献 。 


Ril. 感知 暴力 作为 社会 控制 和 居民 区 社会 构成 的 函数 











网 定 效应 kx 标准 误 se 4 比率 
PRUE yor ~~ 375. 00 39.07 9. 60 
层 -3 预测 变量 
RARER. ya, 0.787 0. 133 5.90 
种 族 隔离 ，yw ， 0. 100 0, 072 1.39 
网 外 出 生 者 的 比例 ，y,: ， -0.044 0. 184 -0.24 
HREH, Yn. - 0, 546 0. 098 -5.55 
_ 方差 苏 方差 分 量 
RRM HB, r 311 





TE: 层 -1 预测 变量 的 结果 与 表 11.8 相同 。 当 每 层 周 定 效应 的 估计 在 层 间 相 互 独立 时 ， 这 些 模 型 
一 般 都 如 此 。 进一步 的 讨论 见 第 14 章 ， 


(6) X 对 了 的 直接 作用 。 这 一 分 析 结 果 也 可 以 用 通 径 图 的 形式 表达 ( 见 图 
11. 1) 。 社 会 控制 的 调整 将 种 族 隔离 和 国外 出 生 者 的 比例 的 贡献 降低 到 不 显著 
KF (f, =0.100, 1=1.39; J, = - 0.044, 1= -0.24)。 贫 困 集 中 度 仍然 
保持 与 感知 暴力 正 相关 ，7,,, =0.787, 4 =5.90， 但 其 系数 看 起 来 明显 小 于 社 
会 控制 调整 前 的 系数 (将 此 处 的 贫困 集中 度 系数 7, ,与 表 11.8 中 的 7， = 
1.285 相 比 ) 。 
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Yo=-0.912 
RARE 一 一 一 一 人 
Y=-0.462 
— 
国外 出 生 者 的 比例 








Y=-1.246 





图 11.1 在 非 正 规 社会 控制 中 介 影 响 下 外 生变 量 
对 暴力 程度 的 直接 和 间接 效应 


(7) 间接 作用 。 表 11.10 列 出 了 总 效应 、 直 接 效应 、 间 接 效应 以 及 相应 的 
标准 误 。 我 们 可 以 看 到 社会 构成 的 各 个 方面 都 有 较 大 的 间接 效应 。 因 此 ， 在 每 
一 方面 ， 社 会 构成 都 通过 其 与 社会 控制 的 联系 与 暴力 情况 相关 联 。0 每 个 间接 
效应 的 幅度 都 远 远 大 于 其 标准 误 ， 显 示 了 社会 控制 的 中 介 效应 统计 性 显著 。 我 们 
注意 到 、 间 接 效应 其 实 是 总 效应 (X 和 了 之 间 的 联系 ) 和 直接 效应 EH TZ 
之 后 三 和 YY 之 间 的 联系 ) 之 差 。 如果 相对 其 估计 标准 误 来 说 规模 较 大 ， 说 明 相 
应 系数 之 差 将 显著 地 大 于 零 。 吕 以 利用 标准 误 米 计算 这 些 差距 的 置信 区 间 。 


表 11.10 将 总 效应 分 解 为 直接 和 间接 成 分 


总 效应 直接 效应 间接 效应 
(se) (se) (se) 
ey. oy 1. 285 0.787 0. 498 
(0.105) | (0. 133) (0.107) 
i Ba 0. 352 0. 100 0, 252 
(0, 060) (0.072) (0. 056) 
国外 出 生 者 的 比例 0, 636 = 0.044 0. 680 
(0. 147) (0, 184) (0. 148) 


(8) 总 结 。 根 据 表 11.8 -~ 11. 10 的 结果 ， 我 们 得 到 的 结论 是 : @ 正 如 假设 


中 ”将 社会 控制 解释 为 社会 构成 和 基 力 关系 的 “中 介 变 量 ” 在 很 大 程度 上 取决 于 模型 设置 的 恰当 
性， 特别 是 需 杰 用 定 社会 控制 不 要 量力 影响 ， 并 且 候 定 没有 中 洼 与 社会 控制 相关 的 其 他 中 介 变 
批 ， 使 用 非 实验 数据 很 准 证 实 这 些 假 定 ， 网 此， 这 些 结果 险 被 认为 是 有 待 继续 研究 的 建议 性 结 
ye 
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的 那样 。 三 项 社会 构成 指标 与 感知 暴力 之 间 正 相关 (总 效应 ); 加 给 定 社会 构 
成 后 ， 居 民 区 的 社会 控制 与 感知 暴力 之 间 负 相关 ; 图 对 社会 控制 进行 调整 后 ， 
我 们 发 现 贫困 集中 度 对 暴力 有 统计 性 显著 的 直接 效应 ， 但 种 族 隔离 和 国外 出 生 
者 的 比例 与 暴力 之 间 均 没有 显著 的 直接 效应 ; 图 居民 区 的 各 XX (贫困 集中 度 、 
种 族 隔离 、 国 外 出 生 者 的 比例 ) 与 感知 如 力 之 间 的 联系 部 分 地 被 居民 区 的 社 
会 控制 所 “解释 ”或 “中 介 影响 ”( 显 示 为 统计 上 显著 的 间接 效应 ) 。 

控制 居民 区 社会 控制 测量 误差 的 重要 性 ”为 了 展示 潜在 变量 模型 对 统计 排 
斯 的 影响 ， 我 们 计算 一 下 第 一 个 感知 暴力 的 多 层 分 析 ， 其 中 预测 变量 完全 一 
样 。 但 社会 控制 是 一 个 显 在 变 贡 而 非 潜 在 变量 。 这 样 就 会 将 方程 11.20 ~ 
11.23 的 三 层 模 型 减少 到 两 层 模型 ， 其 中 原 层 - 2 和 层 - 3 的 预测 变量 现在 分 
别 为 层 -1 和 层 -2 的 预测 变量 ， 显 在 的 社会 控制 变量 在 这 里 只 是 作为 层 -2 
的 另 一 个 预测 变量 ， 代 表 社 会 控制 。 

社会 控制 的 显 在 变量 是 根据 每 个 居民 区 内 样本 应 答 得 到 的 平均 数 ( 见 表 
11.7 的 描述 性 统计 )。 我 们 注意 到 ， 居 民 区 层次 的 社会 控制 显 在 变量 的 可 靠 性 
与 每 个 居民 区 的 样本 规模 密切 相关 。 由 于 样本 规模 大 约 为 20 ~50 人 ， 所 以 这 
可 靠 性 大 约 在 0.70 ~0. 86 的 范围 内 变化 。 在 潜在 变量 分 析 中 考虑 到 了 可 靠 
性 变化 的 问题 ， 但 基于 显 在 变量 的 分 析 却 没有 - 

结果 ( 表 11.11) 正如 预期 的 那样 ， 对 显存 变量 社会 控制 的 系数 估计 小 于 
潜在 变量 模型 的 估计 ( -0.412 相 比 -0.546)。 同 样 需要 注意 的 是 ， 潜 在 变量 
分 析 中 该 系数 的 估计 标准 误 显 然 较 大 ， 反 映 出 社会 控制 的 测量 误差 有 更 大 的 不 
确定 性 。 另 外 ， 社 会 控制 为 显 在 变量 的 模型 巾 ， 对 种 族 隔 离 和 国外 出 生 者 的 比 
例 页 献 的 调整 幅度 较 小 ， 事 实 上 ， 在 使 用 社会 控制 显 性 指标 的 完全 模型 中 ， 种 
族 隔离 保持 了 对 暴力 有 显著 的 直接 作用 - 


RILI 建立 社会 控制 测量 误差 模型 的 结果 





HEMT MEAS 村 会 控制 作为 显 在 自 变 量 
Pe oe 系数 Oo sitë 系数 se 4 比率 
Jt = 2 IE A ae Te i i 
RRR HE 0, 787 0.133 5. 90 0.877 0. 108 8.13 
种 族 隅 离 0. 100 0.072 1.39 0. 157 0.059 2.64 
国外 出 生 者 的 比例 -0.044 0.184 -0.24 0.097 0. 148 0. 66 
Hew -0. 546 0.098 -5.55 -0.412 0.048 -8.63 
He RB fi Jy 2 331 327 


ce —s —ñ — — — 
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总 而 言 之 ， 如 果 忽 略 了 社会 控制 的 测量 误差 ， 就 会 导致 : 由 弱 化 对 社会 控 
制 重要 性 的 认识 ; 四 社会 控制 系数 的 置信 区 间 缩 小 了 ; @ 社 会 控制 对 社会 构成 
和 感知 暴力 关联 的 中 介 影 响 显 得 不 那么 重要 了 。 换 名 话说 就 是 ， 社 会 构成 对 暴 
力 的 直接 效应 被 夸大 了 ， 


分 析 个 人 成 绩 增长 的 两 层 潜 在 变量 举例 


潜在 变量 还 可 应 用 于 增长 研究 。 第 6 章 所 介绍 的 个 人 增长 模型 可 以 很 容易 
地 被 扩展 ， 将 一 个 潜在 增长 参数 作为 男 一 个 潜在 增长 参数 的 函数 来 分 析 ， 比 如 
将 潜在 增长 率 看 作 个 人 潜在 初始 状态 的 函数 。 下 面 介绍 这 种 应 用 。 

在 本 例 中 ， 研 究 的 重点 是 高 中 时 期 数学 成 绩 增长 的 性 别 差 异 。 这 段 时 期 在 
数学 方面 逐渐 增 大 的 性 别 差距 问题 受到 政策 制定 者 、 教 师 和 家 长 的 关注 。 关 键 
的 问题 是 ， 高 中 经 历 是 否 对 拉 大 差距 有 影响 ， 抑 或 是 这 种 差距 增 大 其 实 反映 了 
高 中 以 前 就 开始 出 现 的 性 别 差异 。 以 下 将 要 揭示 出 ,在 8 年 级 时 男生 的 标准 化 
数学 测验 分 数 就 显著 高 于 女生 。 此 外 ， 在 高 中 期 间 ， 男 生 的 增长 率 也 显示 出 大 
于 女生 。 一 般 来 说 ，8 年 级 状况 和 增长 率 之 间 有 正 向 关联 ， 且 作为 结果 ， 增 长 
率 上 的 性 别 差距 可 能 归 因 于 这 种 正 关联 。 因 此 我 们 提出 一 个 模型 ， 其 中 性 别 既 
是 8 年 级 状况 的 预测 变量 ， 也 是 高 中 增长 率 的 预测 变量 。 我 们 希望 了 解 8 年 级 
状况 上 的 性 别 差异 是 否 能 够 解释 性 别 和 高 中 增长 率 之 间 的 关联 。 如 果 能 够 解 
释 ， 则 意味 着 高 中 时 期 逐渐 增 大 的 性 别 差距 是 由 于 高 中 以 前 就 开始 的 变化 。 此 
外 ， 如 果 在 考虑 了 8 年 级 状况 之 后 ， 性 别 和 高 中 增长 率 之 间 还 有 直接 关联 ， 那 
么 就 可 以 说 高 中 经 历 对 高 中 时 期 增 大 的 性 别 差距 有 单独 的 贡献 .了 

本 例 中 使 用 的 数据 来 自 全 国教 育 历 时 研究 (NELS), 1988 年 在 8 年 级 学 
生 中 抽样 ， 然 后 一 直 跟 踪 到 高 中 结束 。 这 里 使 用 的 数据 子 集 是 来 自 2081 名 学 
生 的 信息 。.& 大 多 数学 生 都 有 三 个 时 点 的 完整 数据 。 

层 -1 模型 。 我 们 提出 一 个 数学 成 绩 增长 的 简单 线性 模型 ; 





D 即 他 性 别 和 高 中 成 绩 增长 之 间 没 有 直接 关联 ， 人 们 仍 有 可 能 指责 高 中 未 能 通过 有 效 干 预 来 改善 
这 种 成 绩 增 长 差距 。 不 过 这 种 情况 完全 不 同 于 高 中 经 历 主动 地 扩大 这 个 差距 的 情况 。 

D 这 些 学 生 属 于 商 中 效果 研究 (HSES) 的 NELS 子 集 ， 这 些 学 生 代表 了 30 个 最 大 的 标准 城市 统 
计 区 域 (SMSA). 尽管 学 生 是 央 套 于 学 校 之 中 的 ， 但 为 了 简单 地 演示 潜在 变量 分 析 在 增长 模 
型 中 的 应 用 ， 我 们 省 略 了 这 一 点 - 
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Y, = Wo +m, X (grade - 8); +e; [11.26] 


其 中 ， 必 是 学 生 在 时 间 (的 数学 成 绩 ，( grade-8), 是 获得 该 数学 成 绩 的 年 级 
(对 于 有 完整 数据 的 学 生 ， 年 级 =8, 10, 12), FE, mÆ “WERE”, H 
FE i TE 8 年 级 时 的 数学 成 绩 ， 而 ru 是 学 生 在 高 中 时 期 的 年 增长 率 。 设 层 -1 
RÉ e., t=1, =, 7,， 为 均值 等 于 0 且 有 人 恒定 方差 o 的 正 态 分 布 。 
层 -2 模型 。 初 始 状 态 和 增长 率 作为 性 别 和 个 人 随机 效应 的 函数 ， 每 个 学 
生 都 不 同 : 
To = Bo + Bo X (FEMALE), + tig; [11.27] 
Mi: = Bo +B, x (FEMALE), + u; 
Hep, (FEMALE), 是 女生 的 标识 (1 = 女 ，0 = 男 )， 且 假设 随机 效应 是 二 元 
正 态 分 布 ， 有 方差 rw m 和 协 方差 rn 。 
结果 (R11.12) PR, REE 8 年 级 的 平均 数学 成 绩 为 yw =41.33。 人 性 
别 差 异 显著 ，Y。o, = -1.84, t= -3.27。 这 个 差距 很 小 ， 约 为 平均 数学 成 绩 标 
准 差 的 1/8 ( 见 表 11. 12 的 描述 性 统计 )。 男 生 的 年 增长 率 为 Jo =3.27, t= 
49.83。 女 生 的 年 增长 率 较 低 ， 与 男生 的 差距 为 3 = -0.20, t= -2.11。 尽 
管 效应 看 起 来 很 小 ,但 0. 20 分 的 相对 损失 导致 在 12 年 级 时 女生 比 男 生 落 后 更 
£Z, 达 4x0.20 =0.80 分 ， 结果 在 12 年 级 时 女生 落后 约 1.84 +0.80 =2.64 
分 ， 略 小 于 标准 差 的 1/5。 











表 11. 12 
C) APRAN KAR RT EE 
i 均值 标准 其 sd 
— 2 
数学 成 绩 5645 46. 30 14. 84 
8 年 级 S645 1.82 1.60 
# -2 
tE 2081 0. 50 0. 50 
CO 作为 结果 的 初始 状态 和 增长 率 。 
结果 预测 变量 系数 MR se ue% 
PRE To Rm, Boo 41,328 0. 398 103. 93 


KE, By -1.837 0. 562 -3.27 
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续 表 11. 12 
Hi ME fu E WE 系数 ERE iR se 4 比率 
MR, BE, By 3266 (U.U6S 49. 83 
女生 ,Bi -0.196 0.093 -211 
CO 增长 束 为 结果 ， 补 娩 状 态 和 女生 为 预测 灾民 
Him a M 系数 HAER se 4 比率 
RE, ap — 2 ee 0.181 10. 16 
wE. an -0. 135 0. 095 -1.43 
初始 状态 as 0.033 0. 004 7.85 
CUD 原 系数 和 和 测 整 后 的 系数 比较 i — 
MD Ht HEK 调整 后 的 系数 ER LRH BY BRE IR se 
RE J a =3.266 yg = 1.897 1. 369 0. 187 
女人 Bu = -0.196 ay = -0.135 -0.061 0.020 





我 们 将 洪 存 增长 率 作为 性 别 和 潜在 初始 状况 的 两 数 构造 一 个 模型 ， 用 以 检 
验 高 中 时 期 的 数学 成 绩 差 别 是 否 为 人 学 初始 差距 的 函数 : 


Tu = Am +a, X (FEMALE), +a X my + wr [11.28] 


我 们 关注 的 是 性 别 对 增长 率 的 直接 效应 a,, ， 即 控制 初始 状态 不 变 条 件 下 男女 
生 增 长 率 的 平均 差距 ， 以 及 性 别 通过 初始 状态 的 差距 对 增长 率 的 间接 效应 。 在 
这 里 : 

By - a = anba [11.29] 
其 中 : 

Qn = T/T 


wo = Bo -ap 
残 差 项 ui 是 没有 被 性 别 和 初始 状态 的 组 合 所 解释 的 增长 率 部 分 ， 其 方差 为 : 
Vartuw = Tu A = Tull -p%,..,) [11.30] 


HUE 12 的 结果 显示 : 吓 如 预期 的 一 样 ， 分 忻 别 的 初始 状态 和 增长 率 之 间 有 显 
PAE KB, a, =0.03，! = 7.85; DHE RM BAH, a, = -0.14, t= 


Thm 


OLAR. rr OR fe BETA ET eee er 
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-1.43; 但 是 国 性 别 的 间接 作用 显著 ，B,，- ai = -0.06，se =0.02。 对 分 析 
结果 的 一 种 解释 可 以 是 ， 高 中 逐渐 增 大 的 性 别 差距 在 很 大 程度 上 归 因 于 入 校 
时 已 经 存在 状态 上 的 性 别 差距 ， 即 在 给 定 的 入 学 初始 状况 下 ， 高 中 没有 增 大 
数学 成 绩 的 性 别 差 异 。 这 还 不 如 说 ， 高 中 逐渐 增 大 的 性 别 差 异 不 过 是 更 大 的 
高 中 组 织 效应 的 一 部 分 。 学 生 的 初始 状态 影响 了 所 有 学 生 在 高 中 数学 学 习 方 
面 的 总 收益 的 大 小 。 因 为 女生 在 进 校 时 就 有 些 落后 ， 她 们 更 可 能 进步 较 小 。 
也 就 是 说 ， 可 以 期 望 任何 学 生 ， 不 论 男 女 ， 如 果 在 进 高 中 时 名 次 比较 落后 都 
会 有 同样 的 结果 。 

对 这 个 模型 及 其 估计 结果 的 解释 有 几 个 批评 意见 : 第 一 ， 由 于 在 8 年 级 至 
12 年 级 之 间 有 辍学 者 ， 所 以 高 年 级 学 生 是 一 个 选择 性 的 群体 。 若 男生 国学 率 
高 于 女生 ， 增 长 率 上 的 男女 差距 估计 就 会 有 偏 ， 可 推 知 是 高 估 男 生 的 增长 率 。 
通过 比较 男女 生 辍学 率 可 以 从 一 个 方面 检验 这 个 假定 。 第 二 ，re. 测 量 初始 状态 
的 假定 取决 于 线性 增长 模型 的 有 效 性 ， 可 以 应 用 估计 二 次 效应 模型 来 检验 该 假 
定 。 第 三 ， 这 种 分 析 假 定 随机 效应 有 二 元 正 态 分 布 。 这 个 假定 较 难 检验 ， 不 过 
可 以 应 用 第 9 章 所 介绍 的 方法 。 


非 线 性 分 项 反应 模型 


分 项 反应 模型 常常 应 用 于 教育 测验 ， 来 估计 被 测验 对 象 的 能 力 ( 见 van 
der Linden & Hambleton 在 1996 年 的 综述 ) 。 对 重要 的 研究 目的 而 言 ， 包 括 增 
长 研究 〈 见 第 6 章 ) 和 干预 效果 评估 ， 关 键 是 将 能 力 定义 为 有 意义 的 定 距 量 
度 。 分 项 反应 模型 也 能 使 考题 设计 者 用 于 评价 测验 的 功能 ， 考 察 某 些 项 目的 性 
质 ， 识 别 应 答 模式 反常 的 考生 。 最 近 ， 这 些 模 型 的 应 用 已 经 推广 到 对 态度 、 社 
会 行为 、 精 神 健 康 的 评估 上 。 

可 将 分 项 反应 模型 视 为 分 层 模型 ， 这 样 做 有 许多 益处 (Adams, Wilson, & 
Wu, 1997; Bock, 1989; Cheong & Raudenbush, 2001; Kamata, 1998; Rauden- 
bush & Sampson，1999b) 。 分 层 模 型 形式 为 实现 下 列 分 析 目 的 提供 了 天 然 的 
框架 。 

1. 便于 研究 多 维 评估 ， 即 多 种 能 力 或 特征 的 评估 。 

2. 当 评估 对 象 谍 套 于 社会 环境 中 时 ， 比 如 学 校 或 公司 ， 可 以 自然 地 将 社 
会 环境 之 间 的 不 同 结合 到 分 析 中 去 。 
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3. 在 分 项 反应 模型 情景 下 ， 可 以 在 多 个 层次 定义 和 测量 解释 变量 。 

4. 为 社会 环境 评估 的 测量 误差 研究 提供 了 合适 的 框架 。 

5. 如 本 章 前 几 节 所 述 ， 可 以 将 分 项 反应 模型 定义 的 潜在 变量 作为 解释 变 
HHF, 

6. 分 层 框 架 为 处 理 无 应 答 提 供 了 合适 的 方法 。 

我 们 首先 介绍 如 何 用 两 层 的 分 层 模型 表示 简单 的 单 参数 分 项 反应 模型 ， 如 
何 定义 各 项 目的 “难度 ”和 在 某 种 特征 方面 各 被 测验 对 象 的 “能 力 ”; 接 下 来 
我 们 将 这 个 模型 推广 到 定义 每 个 被 测验 对 象 有 多 种 特征 ; 然后 ， 我 们 再 考虑 将 
其 推广 到 更 一 般 的 多 层 嵌 套 和 潜在 变量 分 析 。 


单项 反应 模型 


为 了 说 明基 本 思路 ,我们 米 考虑 一 个 测量 单一 能 力 或 特征 的 P 项 测验 
(例如 阅读 中 的 “ 字 词 识别 ")。 参 加 测验 的 人 数 为 J/， 每 项 赋值 为 “正确 回 
答 =1” 或 “不 正确 回答 =0"。 单 参数 分 项 反应 模型 也 叫 Rasch 模型 (参见 
Wright & Masters，1982) ， 表 达 了 正确 回答 的 对 数 发 生 比 依赖 于 被 测验 对 象 的 
能 力 和 项 目的 难度 ， 即 : 


Ny = a; ~ 6, [11.31] 


其 中 ，mw 是 正确 回答 的 对 数 发 后 比 ，a 是 被 测验 对 象 j 的 能 力 ，5, 是 项 目 p 的 
难度 。 设 能 力 和 难度 的 均值 缘 为 0。 与 此 相应 ， 被 测验 对 象 j 对 项 目 p 回答 正 
确 的 概率 是 : 


1 


— — 11.32) 
1 + exp( -= ny) [ 32] 


Prob( Y, = 1) = 9, = 
在 经 典 的 Rasch 模型 中 ， 能 力 和 难度 都 是 固定 的 未 知 参数 。 在 用 分 层 模 型 
重建 时 ， 能 力 是 在 被 测验 对 象 总 体 中 随机 变化 的 。Bock 和 Aitkin (1981) 与 
Thissen (1982) 曾 总 结 过 将 能 力作 为 随机 变量 处 理 的 优点 。 
我 们 将 有 随机 能 力 的 Rasch 模型 重建 为 两 层 模型 : 第 一 层 描述 分 项 效应 和 
个 人 能 力 如 何 影响 正确 回答 的 对 数 发 生 比 ; 第 二 层 定义 被 测验 对 象 的 能 力 如 何 
在 总 体 中 变化 。 
Ke -1 模型 。 我 们 的 抽样 模型 为 贝 努 里 分 布 。 假 定 在 给 定 分 项 效应 和 个 人 
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能 力 的 情况 下 ，Y, 取 值 为 ! 并 有 概率 p,。 连 接 函数 为 logit iti, BEA n, = 
logi gp,/(1 - pj)]。 于 是 层 -1 模型 为 


nD, = We D mk {11. 33] 


Tm 是 被 测验 对 象 ) 的 能 力 ; 
是 虚拟 变量 ， 若 被 测验 对 象 j 对 项 目 p 应 答 i， 则 取 值 为 1， 否 则 为 0; 
mm 是 被 测验 对 象 ) 对 项 目 p 回答 正确 和 “参照 项 ”的 对 数 发 生 比 之 差 。 
请 注意 ， 对 应 于 项 目 数 P， 只 有 中- 1 个 虚拟 变量 。 未 用 虚拟 变量 表示 的 
项 即 为 参照 项 ， 其 难度 设 定 为 零 。 


用 两 个 下 标 i 和 p 表示 应 答 机 会 可 能 显得 有 些 古怪 。 诚 然 ， 如 果 所 有 被 测 
验 对 象 回答 了 所 有 项 目 ， 只 需要 一 个 下 标 就 够 了 。 不 过 ， 有 些 被 测验 对 象 可 能 
对 有 些 项 目 没有 应 答 。 在 教育 成 绩 测验 中 这 些 无 应 答 常常 被 视 为 不 正确 ， 因 此 
给 打 0 分 ， 但 在 很 多 重要 情况 下 的 无 应 答 是 有 意 设计 的 结果 。 在 全 美 教育 进步 
评估 、 国 际 成 人 识字 调查 、 第 三 次 国际 数学 和 科学 的 研究 中 都 有 这 种 情况 。 分 
层 模型 为 这 种 缺失 数据 设计 提供 了 合适 的 框架 。 此 外 ， 如 果 不 是 在 测验 成 绩 ， 
而 是 在 评价 态度 或 精神 健康 时 ， 就 会 对 空缺 的 回答 有 不 同 的 看 待 。 为 了 能 够 更 
灵活 地 处 理 缺 失 应 答 ， 我 们 没有 假定 应 答 i 是 针对 任何 特定 的 项 目 ， 因 此 就 需 
要 两 个 下 标 。 

层 -2 模型 。 层 - 1 模型 定义 能 力 (ry) 和 分 项 效应 (r) 可 能 作为 观 
测 协 变量 和 (或 ) 随机 效应 的 函数 在 总 体 中 变化 。 不 过 ， 为 了 与 Rasch 模型 一 
致 ， 我 们 用 一 个 无 条 件 模型 表示 能 力 且 固定 所 有 分 项 效应 : 


Ta = Boo + tiye uy ~ N(0,rom) (11.34) 


Ty = By, p>0 
此 处 的 rw 表示 总 体 中 在 能 力 上 的 方差 。 分 项 效应 被 限定 为 对 所 有 被 测验 对 象 
都 相同 。 这 种 限定 反映 了 一 种 信念 ， 即 在 一 个 “好 ”的 测验 中 ， 某 项 的 难度 
对 某 一 组 能 力 相同 的 被 测验 对 象 而 言 应 当 是 相同 的 ， 否 则 该 项 目 会 被 认为 对 某 
些 感 到 难度 较 大 的 被 测验 对 象 不 公平 。 
在 这 个 模型 中 ， 被 测验 对 象 /对 项 目 p 为 参照 项 时 回答 正确 的 对 数 发 生 
比 为 ; 
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Boy + Uo, [11.35] 

对 其 他 任意 项 p 为 : 
Boo + Bn + to, 11, 36] 
将 其 代入 Rasch 模型 (FFE 11.31), RE CTS MEH: 
a; = ty = Bo + Uy 11.37] 
同时 参照 项 的 项 目 难度 为 ; 


6, =0 11. 38] 


而 其 他 任意 项 p 的 项 目 难 度 为 : 





ô, = - By 11.39] 


于 是 ， 以 分 层 模 型 的 方式 ， 项 目 之 间 的 难度 差异 被 表达 为 回归 系数 之 间 的 差 
异 ， 被 测验 对 象 之 间 的 能 力 差异 被 表达 为 随机 截 距 之 间 的 差异 。 项 目 难度 和 个 
人 能 力 在 以 logit 计量 定义 的 定 距 量 度 上 取 值 。 

当 被 测验 对 象 应 答 不 同 的 项 目 组 时 ， 校 所 应 答 项 目的 难度 相应 调整 能 力 
Tw。 当 评 估 对 象 嵌 套 于 学 校 等 社会 场景 中 时 ， 可 对 两 层 分 项 反应 模型 再 加 第 三 
层 ， 以 便 表 达 这 种 社会 成 员 属性 。 如 此 一 来 ， 可 以 在 第 二 层 或 第 三 姓 纳 入 解释 
变量 来 解释 潜在 能 力 rw 的 变化 。 如 果 考 虑 到 多 种 特征 或 多 种 能 力 的 情况 ， 模 
型 的 可 能 性 便 得 到 进一步 扩展 。 


多 特征 的 分 项 反应 模型 


现在 我 们 的 目的 是 测量 M 种 特征 ， 应 用 P, 项 测量 特征 m，m =1，…，M。 


与 单项 评估 相似 ， 对 每 种 特征 要 有 一 个 参照 项 和 P. -1 个 虚拟 变量 。 结 果 仍 以 
二 项 方式 打分 :“ 正 确 回答 =1” 和 “不 正确 回答 =0"。 

模型 的 第 一 层 描述 分 项 效应 和 多 种 个 人 能 力 如 何 影响 正确 回答 的 对 数 发 生 
比 ， 第 二 层 定义 特征 在 被 测验 对 象 总 体内 变化 和 协 变 。 

层 -1 模型 。 对 每 项 的 抽样 模型 都 是 给 定 每 种 特征 的 个 人 能 力 和 给 定 分 项 
效应 条 件 下 的 贝 努 里 分 布 。 我 们 仍然 采用 logit 连接 ， 层 - 1 结构 模型 为 ; 
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m = DD tray + 了 vi) [11.40] 


其 中 : 

D, 是 虚拟 变量 ， 若 被 测验 对 象 的 应 答 机 会 i 是 对 特征 m 的 测量 则 取 值 
为 1， 否 则 为 0; 

Tw 是 被 测验 对 象 j 对 应 于 特征 m 的 能 力 ; 

,ww 是 虚拟 变量 ， 车 对 项 日 p 的 应 管 是 对 特征 m 的 测量 则 取 值 为 !， 否 则 
为 0; 

7nmw 是 被 测验 对 象 j 对 特征 m 的 项 目 mp 回答 正确 的 对 数 发 生 比 和 “参照 
项 ”相应 对 数 发 生 比 之 差 。 


层 -2 模型 。 用 多 元 无 条 件 模 型 来 表示 特征 ， 并 固定 所 有 分 项 效应 : 


Tan, = Bo + noj [11.41] 


Tay = Bags m=tl,---,M,p>0 


这 里 的 随机 效应 we，…，uww 为 M 元 正 态 分布 ， 均 值 为 0， 方 差 Var(umw) = 
Tao ， 协 方差 Cov(ue ,usw) = Toom 。 如 同 前 面 的 模型 一 样 ， 限 定 分 项 效应 
不 随 个 人 变化 。 

多 元 分 项 反应 模型 可 以 评价 不 同 特征 之 间 的 相关 程度 (控制 了 测量 误 
差 )， 还 可 以 考察 协 变量 与 不 同 特征 之 间 的 关系 是 否 相 同 或 不 同 。 此 外 ， 
还 可 以 在 模型 中 将 一 种 或 多 种 特征 作为 潜在 协 变量 ， 以 便 解 释 其 他 特征 的 
变化 。 

Hl: 青少年 时 期 的 攻击 性 和 不 良 行为 。Cheong 和 Raudenbush (2000) 曾 
根据 Achenbach (1991) 儿童 行为 量 表 (CBCL) 中 的 33 项 研究 了 攻击 性 和 不 
良 行为 之 间 的 相关 。 每 项 应 答 均 为 二 项 编码 (1 表示 儿童 明显 有 该 项 行为 ，0 
表示 没有 明显 行为 ) 。 按 照 儿 童 行为 量 表 使 用 手册 ，33 项 中 有 20 项 评价 攻击 
性 ， 其 余 13 项 评价 不 良 行为 。 

(1) 层 -1 模型 。Cheong 和 Raudenbush 在 层 -1 使 用 logit 连接 函数 : 


19 n 
M = Da muy + D Tunus) t Da Taig + 也 mangun) [1L42] 
* mi 


其 中 : 
D .is 是 虚拟 变量 ， 若 被 测验 对 象 j 的 第 i 项 回答 是 关于 攻击 性 方面 的 则 取 
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值 为 !， 否则 为 0; 而 若 被 测验 对 象 /的 第 ;项 回答 是 关于 不 良 行为 方面 的 则 
Daag =1 -Ds 取 值 为 1; 

Two 是 儿童 的 潜在 攻击 性 水 平 ，riuw 是 该 儿童 的 潜在 不 良 行为 水 平 ; 

Xi 是 虚拟 变量 ， 若 对 第 p 项 的 回答 是 对 特征 m 的 测量 则 取 值 为 1， 和 否则 
#0, XE, m = agg 或 m = del; 

Ti 是 被 测验 对 象 对 特征 m, m= agg 或 m = del 的 项 目 mp 回答 正确 的 对 
数 发 生 比 和 “参照 项 ”相应 对 数 发 生 比 之 差 。 


(2) 层 -2 模型。 首先 建立 一 个 二 元 无 条 件 模型 ; 


Toe) = Baroo + “ogg 0) 
Tino = Besos + Heer os [11.43] 


Taj = Bays m = agg, del, p > 0 


这 项 研究 表明 攻击 性 与 不 良 行为 高 度 相关 。 作 者 还 拟 合 了 一 个 有 协 变量 的 
模型 ; 


9 
Tagoj = Bano * Ebu, + Waray 
* 


9 
11. 44 
Tangy = Baroo + ¥ Bia W, + Uo [ ] 
mi 


Tay = Baws m = agg, del, p > 0 


其 中 ， 协 变量 WW,，g = 1，…, 0Q， 包 括 年 龄 以 及 性 别 与 种 族 的 标识 。 作 者 发 现 
年 龄 和 性 别 对 不 良 行为 比 攻击 性 有 更 强 的 效应 。 这 意味 着 ， 尽管 攻击 性 和 不 良 
行为 的 特征 高 度 相 关 ， 但 它们 并 不 能 被 简单 地 视 为 服从 同一 潜在 维度 。 

作者 将 该 分 析 扩 展 到 三 屋 ， 即 考虑 儿童 所 居住 的 居民 区 。 他 们 研究 了 居民 
区 劣势 条 件 和 攻击 性 与 不 良 行为 的 关系 ， 发 现 前 者 与 后 两 项 之 间 都 存在 类 似 的 
正 关联 。 


二 参数 模型 
本 章 所 讨论 的 分 项 反应 模型 被 称 为 “ 单 参数 ”模型 ， 因 为 每 一 项 都 是 用 


一 个 参数 即 项 目的 难度 ) 表示 的 。 单 参数 模型 的 关键 假定 是 ， 描 述 特征 
和 正确 回答 概率 之 间 的 关联 曲线 是 平行 的 。 如 果 该 假定 不 成 立 ， 可 以 选择 用 
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二 参数 模型 ， 其 中 第 二 个 参数 负责 解释 特征 和 概率 关联 曲线 的 不 同 斜率 问题 
(Birnbaum ，1968 ) 。 上 述 问题 可 以 用 一 个 分 层 模型 来 表示 ， 其 中 对 随机 效应 
使 用 了 因子 分 析 模 型 ( Miyazaki，2000) ， 不 过 这 种 应 用 已 超出 本 章 的 范围 。 


本 章 术语 概要 


缺失 数据 问题 


潜在 变量 : 无 法 直接 观测 的 变量 。 将 潜在 变量 设想 为 缺失 数据 往往 很 有 
帮助 。 

完整 数据 : 包括 观测 数据 和 缺失 数据 。 

残缺 数据 : 只 包括 观测 数据 。 

完全 随机 缺失 数据 (MCAR) : 缺失 数据 为 完整 数据 的 随机 样本 。 在 这 种 
情况 下 ， 某 数据 缺失 的 概率 与 该 数 了 到 值 无 关 。 

随机 缺失 数据 (MAR): 在 考虑 所 有 其 他 观测 数据 以 后 ， 某 数 缺 失 的 概率 
与 该 数 取 值 无 关 。 

模型 式 填 补 : 在 给 定 观测 数据 条 件 下 从 完整 数据 的 分 布 抽样 。 多 元 模型 式 
填补 产生 多 组 “完整 ”数据 ， 其 中 的 缺失 数据 用 模型 式 填补 方法 补 齐 。 多 元 
数据 组 的 适当 分 析 会 根据 数据 随机 缺失 的 假定 得 到 模型 参数 的 一 致 性 估计 及 其 
标准 误 。 即 使 数据 随机 缺失 的 假定 不 成 立 ， 只 要 缺失 信息 部 分 很 小 ， 该 推断 仍 
旧 是 稳健 的 。 

有 效 估计 : 应 用 观测 数据 的 所 有 信息 估计 出 产生 完整 数据 的 参数 。 这 种 有 
效 估计 还 在 数据 随机 缺失 假定 下 生成 模型 参数 的 一 致 性 估计 及 其 标准 误 。 而 且 
即使 数据 随机 缺失 假定 不 成 立 ， 只 要 缺失 信息 部 分 很 小 ， 该 推断 也 仍旧 是 稳 
健 的 。 


测量 误差 问题 


测量 误差 模型 : 在 给 定 潜 在 变量 以 及 (如 有 可 能 ) 其 他 缺失 数据 的 情况 
下 ， 定 义 观测 数据 的 分 布 。 

分 项 反应 模型 : 表达 了 这 样 的 观念 ， 即 潜在 个 人 特征 和 潜在 分 项 特征 如 何 
共同 决定 了 某 人 对 某 项 问题 的 应 答 。 
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Rasch 模型 : 一 种 分 项 反应 模型 ， 表 达 了 某 人 对 某 项 问题 的 应 答 为 此 人 在 
所 测 特征 中 的 取 值 和 该 项 问题 的 难度 或 严重 程度 的 函数 。 对 任何 个 人 特征 和 项 


目 难 度 ， 假 定 分 项 反应 是 独立 的 
二 参数 分 项 反应 模型 : 表达 了 某 人 对 某 项 问题 的 应 答 为 此 人 特征 加 上 两 个 


项 目 参数 的 函数 ， 这 两 个 参数 分 别 为 项 目 难度 和 项 目 区别 。 对 任何 个 人 特征 和 
这 两 个 参数 ， 假 定 分 项 反应 是 独立 的 。 


Z2? 


交互 分 类 的 随机 效应 模型 


o 对 交互 分 类 的 随机 效应 模型 的 公式 化 和 检验 
Hl: 苏格兰 教育 成 绩 中 的 邻里 效应 与 学 校 效 应 
日 例 2: 儿童 在 小 学 阶段 认 知 能 力 增长 中 的 班级 效应 
e 小 结 

. 本 章 术语 概要 


迄今 为 止 ， 本 书 所 讨论 的 所 有 应 用 都 属于 严格 的 分 层 数 据 结构 。 比 如 ， 在 
第 5 章 我 们 考虑 个 人 〈 层 -1 单位 ) REFAM ( 层 -2 单位) 时， 是 假定 每 
个 人 属于 一 个 组 织 ， 并 且 只 属于 一 个 组 织 。 第 8 章 加 上 了 第 三 个 层次 〈 学 生机 
套 于 班级 ， 班 级 再 舱 套 于 学 校 ) ， 我 们 假定 每 一 个 学 生 属 于 一 个 班级 ， 并 且 只 
属于 一 个 班级 ， 每 一 个 班级 属于 一 个 学 校 ， 并 且 只 属于 一 个 学 校 。 我 们 现在 要 
考虑 的 是 一 种 更 复杂 的 数据 结构 ， 其 中 较 低层 次 的 单位 要 对 两 个 或 更 多 的 较 高 
层次 的 单位 进行 交互 分 类 。 在 社会 科学 中 ， 具 有 这 种 数据 的 模型 已 经 得 出 许多 
有 意思 的 研究 结果 。 

比如 ， 社 区 环境 和 学 校 都 对 学 生 的 学 习 成 绩 产 生 影响 。 我 们 可 以 看 到 ， 某 
一 社区 会 把 自己 的 孩子 “ 送 ” 到 不 同 的 学 校 中 去 ， 而 某 一 学 校 会 从 不 同 的 社 
区 中 收取 学 生 。 比 如 ，Garner 和 Raudenbush (1991) 曾 对 分 属于 524 个 小 区 和 
17 所 学 校 的 2310 个 学 生 进行 研究 。 有 关 数 据 结构 在 表 12. 1 中 给 出 。 其 中 , 行 
代表 小 区 ， 列 代表 学 校 。 在 这 个 交互 矩阵 中 的 数字 为 计数 ， 即 居住 于 特定 小 区 
并 就 学 于 特定 学 校 的 学 生 人 数 。 比 如 ， 我们 看 到 6 个 儿童 居住 于 小 区 259 并 在 
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学 校 10 上 学 ， 有 1 个 儿童 居住 于 同一 小 区 但 在 学 校 11 上 学 ， 同 一 小 区 中 还 有 
| 2 个 儿童 在 学 校 16 上 学 。 注 意 ， 行 合计 总 数 给 出 了 各 小 区 的 儿童 数量 ， 而 列 
合计 总 数 则 给 出 了 每 个 学 校 的 儿童 数量 。 

这 一 类 数据 的 分 析 可 以 服务 于 不 同 的 目的 : 


证 以 估计 不 同 小 区 、 不 同学 校 、( 按 小 区 一 学 校 划分 的 “交互 单元 ”或 
“交互 组 ”中 的 ) 不 同 儿童 之 间 在 结果 上 的 方差 分 量 ; 

可 以 辨别 小 区 和 学 校 的 特征 与 儿童 们 的 结果 之 间 的 联系 ，; 

可 以 在 控制 了 学 生 、 小 区 和 学 校 特 征 的 条 件 下 估计 小 区 之 间 、 学 校 之 
间 以 及 交互 组 之 内 在 结果 差异 上 的 残 差分 量 ; 

可 以 评价 学 生 特征 与 结果 之 间 的 关联 模式 在 小 区 之 间 、 学 校 之 间 和 交 
互 组 之 间 有 多 大 程度 的 差别 ; 

可 以 评价 小 区 特征 的 影响 在 不 同学 校 之 间 的 变异 程度 (以 及 学 校 影响 
在 小 区 之 间 的 变异 程度 ); 

© 估计 与 特定 小 区 或 学 校 相 联系 的 特殊 效应 (“随机 效应 ” ) 。 


R121 苏格兰 小 区 研究 中 的 组 织 数据 : 各 小 区 一 学 校 交互 单元 中 的 观察 数 
学 g 











doe oO 1 2 3 4 5 6 7 8 9 10 1 12 13 14 1 16 合计 
26 yos 
27 1 1 
29 1 8 9 
30 2 2 
31 1 1 2 
32 1 5 6 
33 1 Ba 3 
35 SEA > 
36 o 
38 1 和 
251 4 1 5 
252 — bY 
253 3 3 
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续 表 12.1 
学 g 

小 区 0 1 2 3 4 5 6 7 8 9 1 11 12 13 14 15 16 合计 
e ee E ee i 2 2 
258 4 4 
259 6 1 2 9 
260 6 6 
261 a 3 6 
263 14 1 1 16 
793 6 6 
794 1 1 11 13 
795 2 1 3 
796 9 1 10 
797 3 1 4 
798 10 10 
79 1 1 2 
800 3 1 4 
801 4 2 
803 3 3 
frit 146 22 146 159 155 101 286 112 136 133 92 190 111 154 91 102 174 2310 


当然 ， 表 12. 1 的 数据 并 不 反映 经 典 方差 分 析 的 平衡 双 因 素 设 计 。 和 矩阵 
中 每 个 单元 的 样本 规模 有 很 大 差别 ， 还 有 许多 交互 单元 是 没有 值 的 空 单 元 。 
此 外 ， 一 些 自 变量 是 连续 型 的 而 另 一 些 自 变量 是 离散 型 的 。 于 是 ， 便 不 能 简 
单 地 应 用 经 典 的 双 因 素数 据 分 析 方 法 。Raudenbush (1993) 应 用 交互 分 类 的 
随机 效应 模型 重新 分 析 了 这 一 数据 ， 我 们 将 在 本 章 的 后 面 对 这 一 分 析 进 行 
扩展 。 

交互 分 类 结构 还 有 另 一 种 重要 类 型 ， 即 每 一 个 学 生 按 照 所 就 学 的 初中 和 高 
中 做 交互 分 类 。Goldstein (1995) 应 用 交互 分 类 随机 效应 模型 评价 了 两 种 不 同 
类 型 学 校对 学 生成 绩 差异 的 相对 重要 性 。 同 样 的 结构 可 以 用 于 对 工人 做 职业 和 
行业 的 交互 分 类 。 这 样 我 们 便 可 以 在 控制 行业 影响 的 条 件 下 分 析 不 同 职业 的 收 
人 差异 ,还 可 以 分 析 在 控制 职业 差别 影响 的 条 件 下 分 析 行 业 之 闻 的 收入 差异 。 
这 种 类 型 的 研究 也 可 以 应 用 十 重复 测量 研究 ， 后 面 第 二 个 例子 所 示范 的 便 是 这 
种 应 用 。 
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现在 重要 的 是 将 交互 分 类 随机 效应 结构 与 前 面 各 章 所 描述 的 其 他 分 层 模 
型 的 结构 区 别 开 来 。 我 们 来 考虑 一 个 例子 ， 在 菜 一 地 点 ( 比如 学 校 或 诊所 ) 
进行 实验 ， 所 有 的 人 都 被 分 配 到 实验 组 和 控制 组 ， 这 一 实验 在 许多 不 同 地 点 
重复 进行 。 于 是 实验 处 理 与 地 点 便 构成 表 12. 2 中 所 示 的 交互 分 类 。 表 中 的 
每 一 列 代表 一 个 地 点 ， 每 一 行 代表 一 种 处 理 情况 。 尽 管 这 种 数据 结构 与 表 
12.1 很 相似 ,但 它们 之 间 存 在 着 重要 的 差别 。 在 小 区 一 学 校 研究 中 ， 研 究 
人 员 要 做 的 是 从 小 区 和 学 校 的 样本 推断 其 总 体 。 所 以 ， 小 区 和 学 校 两 种 效应 
都 被 作为 随机 效应 。 然 而 ， 在 实验 处 理 一 地 点 的 分 析 场 合 ( 表 12.2) ， 研 究 
目的 关注 的 只 是 对 实验 处 理 做 出 具体 论断 (而 不 是 要 推断 到 “所 有 可 能 的 
处 理 情况 的 总 体 ") ， 但 是 研究 人 员 确 实 希 望 将 研究 发 现 推断 到 不 同 地 点 的 
总 体 。 所 以 ， 在 表 12. 2 中 ， 实 验 处 理 的 效应 被 作为 固定 效应 ， 而 地 点 效应 
被 作为 随机 效应 。 这 种 方案 可 以 用 两 层 分 层 模型 分 析 ， 其 中 将 参与 对 象 作为 
层 -1 单位 ,将 地 点 作为 层 -2 单位 。 不 同 的 实验 处 理 用 层 - 1 变量 代表 ， 即 采 
用 虚拟 变量 或 其 他 对 比 编码 。 但 是 ， 本 章 所 关注 的 情况 却 是 两 个 或 多 个 随机 效 
应 的 交互 分 类 。 


R122 按 实验 处 理 和 地 点 类 型 交互 分 类 的 I xm 个 学 生 











(处 于 了 个 地 点 的 N 个 学 生 ) 
地 点 1 地 点 2 * 地 点 J 
osm FO ġo 7 å 
em + 3 E $ 
n n n Jn 





E: 地 点 为 随机 因素 ， 实 验 处 理 为 因 定 因素 。 


对 交互 分 类 的 随机 效应 模型 的 公式 化 和 检验 
无 条 件 模型 


以 表 12. 1 为 例 ， 我 们 可 能 只 是 对 小 区 之 间 、 学 校 之 间 以 及 交互 组 之 内 的 


D 从 贝 叶 斯 合计 角度 来 看 ， 周 定 效应 与 随机 效应 之 间 的 区 别 是 很 大 的 。Raodenbush (1993) 提供 
了 关于 交互 分 类 模型 的 贝 叶 斯 理论 解释 。 关 于 贝 叶 斯 原理 的 细节 请 参见 第 13 章 - 
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变异 成 分 的 估计 感 兴 超 。 这 种 模型 是 无 条 件 模型 ， 即 它 在 任何 层次 都 不 包括 自 
E, 

层 -1 和 “组 内 ”模型 。 XEDA — A a E A EPA eB — H JL 
童 ， 组 内 模型 描述 了 这 些 儿 童 的 变异 。 在 无 条 件 模型 中 ， 我 们 有 : 


Yu = Fop tee, ey ~ N(O,a°) [12.1] 


其 中 : 

Ya 是 居住 于 小 区 j 和 学 校 上 的 儿童 i 的 学 习 成 绩 ; 

7on 是 交互 组 关中 儿童 的 平均 成 绩 ， 即 居住 于 小 区 j 并 就 学 于 学 校 上 的 儿 
章 的 平均 成 绩 ; 

ew 是 随机 的 “儿童 效应 "， 即 儿童 就 的 成 绩 距 离 交互 组 平均 值 的 离 差 。 


假定 这 些 离 差 服从 平均 值 为 0、 组 内 方差 为 er 的 正 态 分 布 。 
于 是 ， 下 标 分 别 表示 儿童 、 小 区 、 学 校 ， 其 中 有 : 


i=1，…， na 个 在 组 关中 的 儿童 ; 
j=1, =, J=524 个 小 区 ; 
k=1，…,，K =17 FER, 


-2 或 “组 间 ” 模 型 。 我 们 将 组 间 差 异 归 因 于 小 区 效应 、 学 校 效应 以 及 
(可 能 存在 的 ) 小 区 一 学 校 的 交互 效应 : 


Top = Oa + Bow + cons + doy 
bw ~ NCO, Tw) 

* * [12.2] 
Cou ~ N(O, Fan) 


dy ~ N(O,ra) 


其 中 : 

0, 是 所 有 儿童 的 成 绩 总 平均 数 ; 

bw 是 小 区 j 的 随机 主 效应 ， 即 小 区 j 在 控制 了 学 校 差 异 条 件 下 的 贡献 BL 
定 其 服从 平均 值 为 0 和 方差 为 rw 的 正 态 分 布 ; 

co 是 学 校 上 的 随机 主 效应 ， 即 学 校 上 在 控制 了 小 区 差异 条 件 下 的 贡献 ， 
假定 其 服从 平均 值 为 0 和 方差 为 rm 的 正 态 分 布 ; 

必 是 随机 交互 效应 ， 即 交互 组 平均 值 与 根据 总 平均 值 和 两 个 主 效应 对 本 
组 的 预测 值 之 间 的 离 差 ， 假 定 其 服从 平均 值 为 0 和 方差 为 rm 的 正 态 分布 。 
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在 许多 应 用 研究 中 ， 组 内 样本 规模 不 够 大 ， 不 能 区 分 归 因 于 rw 的 方差 和 组 
内 方差 o ， 因 而 不 得 不 从 模型 中 排除 这 个 交互 效应 ， 使 组 内 方差 和 交互 效应 方 
差 合 并 到 一 起 。 表 12. 1 中 的 数据 就 是 这 样 一 种 情况 ， 它 的 交互 组 规模 非常 小 。 
组 合 模型 。 将 方程 12. 2 代 人 方程 12. 1 ， 得 到 一 个 组 合 模型 : 


Vig = b+ boo + co + doa + ep [12.3] 


它 也 可 以 被 看 作 是 一 个 由 随机 的 行 效 应 bm 、 列 效应 cw, 、 双 因素 交互 效应 doa 
以 及 随机 的 组 内 离 差 en 所 构成 的 双 因 素 方 差分 析 。 

方差 的 分 解 与 可 靠 性 。 方 程 12. 1 和 12. 2 中 描述 的 两 层 模 型 将 结果 的 总 方 
差分 解 为 一 个 组 内 分 量 o* 和 一 个 组 间 分 量 。 组 间 分 量 又 进一步 被 分 解 为 三 个 
部 分 : 小 区 之 间 的 方差 rm; 学 校 之 间 的 方差 ro; 以 及 交互 组 之 间 的 残 差 方 
差 7w%， 即 交互 组 之 间 那 些 既 不 能 被 当 作 行 方差 也 不 能 被 当 作 列 方差 的 其 余 方 
差 。 这 种 设置 产生 了 三 种 组 问 相关 系数 ， 

1. 居住 于 同一 小 区 并 就 学 于 同一 学 校 的 两 个 儿童 之 间 在 结果 上 的 相关 : 


Two + Tao +7, 
corr yu Yon) = puy = 一 衬 一 之 M [12.4} 
Two + Tao tTa tO 


2， 居 住 于 同一 小 区 但 就 学 于 不 同学 校 的 两 个 儿童 之 间 在 结果 上 的 相关 : 


T 
corr( Yy Y) = py = es — [12.5] 
se Bu w 


3. 就 学 于 不 同学 校 但 居住 于 同一 小 区 的 两 个 儿童 之 间 在 结果 上 的 相关 : 


ay 7 
corr( Yas Ym) =p, = 一 -一 — ; 
Tio + Too + Tan +o 





[12.6] 


我 们 也 许 还 希望 估计 一 种 可 靠 性 ， 即 从 就 学 于 特定 学 校 的 那些 人 识别 社区 
效应 的 可 靠 性 : 


Two * Tam RN [12.7] 


reliability! (b, + day) Í Coun) = A 


与 此 相对 ， 还 可 以 估计 出 居住 于 同一 小 区 的 那些 人 识别 学 校 效 应 的 可 靠 性 : 


上 [12.8] 


reliability[ (ĉo + doi) | boo, ] = i a/n 
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条 件 模型 


方程 12.1 和 12.2 是 完全 的 无 条 件 模型 ， 它 们 将 变异 定义 为 与 学 生 、 小 
区 、 学 校 的 效应 以 及 小 区 一 学 校 的 交互 效应 相 联系 。 可 想 而 知 ， 每 种 差异 都 可 
以 部 分 地 由 观测 变量 来 解释 。 也 就 是 说 ， 学 生 特 征 、 小 区 特征 、 学 校 特 征 以 及 
它们 之 间 的 有 关 交 互 项 都 可 以 成 为 自 变量 。 

交互 分 类 的 随机 效应 的 双 因 素 模 型 中 包括 了 极为 丰富 的 、 可 能 的 模型 种 
类 。 比 如 ， 小 区 的 特征 可 能 对 所 研究 的 结果 产生 效应 。 而 这 种 效应 既 可 以 被 
定义 为 是 固定 的 ， 也 可 以 被 定义 为 是 随机 的 ， 或 者 被 定义 为 在 学 校 之 间 非 随 
机 变化 。 比 如 ，Garner 和 Raudenbush (1991) 发 现 小 区 的 社会 旭 夺 情况 对 学 
习 成 绩 存在 影响 ， 而 这 种 影响 的 幅度 可 能 又 依赖 于 学 生 所 在 学 校 中 的 社会 组 
织 。 与 此 类 似 ， 学 校 特征 的 影响 可 能 在 不 同 小 区 中 变化 。 下 面 ， 我 们 来 考虑 
一 下 学 习 成 绩 与 学 生 的 背景 特征 诸如 民族 和 社会 阶层 之 间 的 联系 。 这 种 联系 
可 能 依赖 于 小 区 的 或 学 校 的 观测 或 未 观测 的 特征 ， 以 及 小 区 一 学 校 特征 之 间 
的 互动 特征 。 

在 建立 模型 方面 丰富 的 可 能 性 导致 很 难 写 出 一 个 简单 的 一 般 公式 ， 而 不 得 
不 使 用 相当 复杂 的 标注 方式 。 所 以 ， 为 了 阐明 这 一 模型 的 原理 ， 我 们 将 考虑 一 个 
有 三 个 层 -2 变量 的 方案 ,包括 : 一 个 小 区 特征 W, DERRE X,, URE 
们 之 间 的 互动 项 W'X,。 这 三 个 解释 变量 可 以 用 来 说 明 任何 一 个 层 -1 系数 rm 
上 的 变化 ， 即 与 小 区 一 学 校 矩 阵 中 定义 的 交互 单元 大 相 联系 的 变化 。 

为 了 使 说 明 更 为 简单 ， 让 我 们 考虑 一 个 像 表 12. 3 中 那样 的 具有 平衡 数据 的 


假设 数据 结构 。 其 中 ， 我 们 有 J =6 个 小 区 被 随机 分 配 为 实验 处 理 { W, = 5) RE 
控制 处 理 人 W = - 5). 我 们 还 有 =4 个 学 校 ， 其 中 随机 地 各 分 配 2 个 为 实验 
处 理 | X, = 却 } 和 控制 处 理 { K = - 六] 。 于 是 ， 共 存在 JK = 24 个 单元 ， 并 且 在 
每 个 单元 中 我 们 随机 抽取 n = n =20 个 样本 。 学 生 有 一 半 是 女生 { ou =), 


SEB A (ay = — 5). 这 样 一 种 设计 可 能 只 有 很 小 的 统计 功效 ， 我 们 在 这 
里 应 用 它 只 是 作为 一 种 阐明 原理 和 标注 方法 的 手段 。 


3600 分 层 线性 模型 : 应 用 与 数据 分 析 方 法 


表 12.3 ”对 小 区 和 学 校 的 假设 实验 研究 的 数据 形式 ， 小 区 和 学 校 都 被 作为 随机 因素 
PREKER, X 
实验 组 | 控制 组 





x= -十 


3 c=4 





小 区 层次 变量 ， 罗 实验 组 





a 
n 
n 
n 
n 
n 











6n 








注 : RAMA OW 为 固定 因素 : 


组 内 模型 。 对 每 一 个 小 区 一 学 校 交互 单元 ， 模 型 都 定义 了 一 个 单元 平均 成 
绩 和 一 个 性 别 差距 : 


Ya = Toy + ity + ey, ea ~ N(0,0°) [12.9] 


其 中 : 

Ya HEE AN j 和 学 校 中 的 学 生 i 的 成 绩 ; 

Tu 是 截 距 ， 在 本 例 中 为 单元 关 的 平均 成 绩 ; 

oo 标注 了 学 生 jk WESI kE =>, 男生 = - 方 ); 

mu 是 将 an 和 yu 关联 起 来 的 回归 系数 ， 在 本 例 中 代表 在 单元 让 中 女生 和 
男生 在 平均 成 绩 上 的 差异 或 称 “ 性 别 差距 ”; 

ct 是 单元 内 的 随机 效应 ， 代 表 学 生 的 成 绩 与 根据 其 性 别 预 测 的 成 绩 之 
间 的 离 差 。 假 定 这 一 随机 效应 服从 平均 值 为 0、 方 差 为 0? 的 正 态 分 布 。 


层 -2 或 “组 间 ” 模 型 。 层 -1 模型 定义 了 两 个 具体 单元 的 系数 ，mm， 
P=0，1， 分 别 代表 平均 成 绩 和 成 绩 上 的 性 别 差距 。 这 些 层 - 1 系数 成 为 层 -2 
模型 中 的 结果 ， 代 表 了 由 两 个 随机 因素 ( 即 小 区 和 学 校 ) 所 造成 的 交互 组 之 
间 的 变异 。 建 立 模型 时 可 以 将 这 些 变异 作为 层 -2 自 变量 的 函数 ， 这 些 自 变 量 
描述 了 小 区 、 学 校 、 小 区 一 学 校 互动 以 及 其 他 反映 小 区 与 学 校 不 同 组 合 的 特征 。 
此 外 ， 行 效应 〈 即 小 区 自 变 量 的 效应 ) 能 够 在 不 同 列 之 间 随 机 变化 ， 而 列 效应 
( 即 学 校 层次 的 自 变量 ) 可 以 在 行 间 随 机 变化 。 由 于 模型 的 框架 相当 丰富 和 灵 
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活 ， 我 们 先 来 考虑 一 些 简单 的 情况 ,然后 再 逐渐 过 滤 到 较 复杂 的 完全 模型 。 
(1) 一 个 层 -2 行 自 变量 和 一 个 层 -2 列 自 变量 的 固定 效应 。 假 设 小 区 变 
二 和 学 校 层次 自 变量 都 对 rm 存在 主 效应 。 层 -2 方程 为 : 


Te =O, + BX, +y, W, + by + cm + ds, p=0,1 {12. 10} 


其 中 : 

6, 是 模型 截 距 ， 即 当 所 有 解释 变量 被 设 为 0 时 rm 的 期 望 值 (在 这 种 情况 
F, 0, 是 总 平均 值 ); 

B, 是 XX 的 固定 效应 (假定 在 总 体 中 所 有 小 区 不 变 ) ; 

y, 是 W 的 固定 效应 (假定 在 总 体 中 所 有 学 校 不 变 ) ; 

bo. Co Ad, TH, TERT W, 和 XX 的 影响 以 后 ， 小 区 、 学 校 及 小 
区 一 学 校 互动 在 7 上 的 残 差 随机 效应 。 

(2) 一 个 层 -2 行 自 变量 和 一 个 层 -2 列 自 变量 的 随机 变化 效应 。 在 上 述 
模型 中 ， 学 校 特征 X 的 效应 被 假定 为 对 所 有 小 区 不 变 。 类 似 地 ， 小 区 特征 W, 
的 效应 被 假定 为 对 所 有 学 校 不 变 。 但 是 其 实 两 者 都 可 能 随机 变化 ， 因 此 将 这 一 
模型 的 层 -2 方程 扩展 为 : 


Ty =O, + (By + bi IX, + Cry + Ca) W, + bo + co + day (12.11) 


其 中 : 
9, 是 模型 截 距 ， 即 所 有 解释 变量 被 设 为 0 时 rm 的 期 望 值 ; 

B, eX, 的 固定 效应 (对 总 体 中 所 有 小 区 平均 化 ) ; 

bu 是 小 区 了 对 X 和 mm 之 间 联 系 的 随机 效应 ; 

y, 是 到 的 平均 效应 〈 对 总 体 中 所 有 学 校 平 均 化 ) ; 

Cpu EFE k II W, 和 mw 之 间 联 系 的 随机 效应 ; 

bojs Ea du 分 别 为 小 区 、 学 校 及 小 区 一 学 校 互 动 在 rw 上 的 残 差 随机 
效应 。 


(3) 解释 层 -2 行 、 列 自 变量 的 随机 变化 效应 。 方 程 12. 11 其 实 与 通常 两 
层 分 析 中 的 无 条 件 层 ~2 模型 很 类 似 。 如 果 我 们 将 方程 12. 11 的 组 合 模型 写成 
分 层 的 形式 ， 便 可 以 清楚 地 看 出 : 


Ty = 9, + BX, + yaW + bo + Cy + dy 


与 By = B, + by, [12. 12a] 
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(12. 12b] 


Yu = Y, + ens 


注意 ,方程 12. 12a 和 12. 12b 是 无 条 件 模型 ， 也 就 是 说 ， 它 们 不 包括 
层 -2 自 变量 。 如 果 已 知 B, 和 ,分 别 在 小 区 和 学 校 随机 变化 时 ， 自 然 会 考虑 是 
香 将 小 区 的 观测 特征 ( 即 其 他 的 WO 纳 人 作为 方程 12. 12a 中 的 自 变 量 。 与 此 
类 似 ， 学 校 的 观测 特征 〔 及 其 他 的 NL) 也 可 以 被 纳入 方程 12. 12b， 但 是 需要 
考虑 一 种 复杂 性 。 在 方程 12. 12a 中 纳入 WW 作 为 自 变 量 实 际 上 等 价 于 在 方程 
12. 12b 中 纳入 XX, 作为 自 变量 。 也 就 是 说 ， 它 们 能 够 得 到 同样 的 组 合 模型 : 


Ty = 0, + (B, + bX + Cy, +E) W, + 8X, XW, + by toy td [12.13] 


Hip, 6, EXET X xw HAAR. 

由 于 这 个 原因 ， 最 好 采用 组 合 模型 公式 的 方程 12. 13 作为 对 交互 随机 效应 
研究 的 基本 模型 框架 。 此 外 ， 它 还 能 容纳 另外 一 种 新 奇 的 可 能 性 ， 即 可 以 为 交 
互 组 层次 效应 rm 加 入 自 变 最 ， 而 这 样 的 自 变 量 只 能 在 交互 组 层次 来 定义 。 比 
如 ， 居 住 于 小 区 7 并 在 学 校 上 上 学 的 学 生 的 平均 成 绩 ras ， 可 能 受 所 居住 小 区 
与 就 学 学 校 之 间 的 距离 的 影响 。 这 样 一 个 变量 值 ， 比 如 说 Z,， 依 赖 于 小 区 和 
学 校 的 特定 组 合 ， 而 不 能 简单 地 用 XX, AW, 的 交互 乘积 来 代表 。 将 这 样 一 个 变 
晤 加 入 方程 12. 13 ， 便 会 产生 一 个 另外 的 固定 效应 ô, o 

表 12.4 概括 了 由 方程 12.9 和 12. 13 分 别 定义 的 层 - 1 系数 x, 的 差异 来 
源 。 除 了 O) 平均 值 以 外 ， 还 有 三 种 基本 的 差异 来 源 : 小 区 之 间 的 差异 、 学 
校 之 间 的 差异 以 及 学 校 一 小 区 互动 的 差异 。 小 区 之 间 的 差异 又 被 分 解 为 两 种 : 
由 小 区 层次 固定 效应 解释 的 部 分 (2) ， 以 及 未 能 解释 的 部 分 (3)。 学 校 之 间 
的 差异 也 同样 被 分 解 为 两 种 ， 由 固定 效应 解释 的 部 分 (4) 和 未 能 解释 的 部 分 
(5)。 小 区 的 两 个 成 分 与 学 校 的 两 个 成 分 之 间 两 两 互动 ， 形 成 小 区 一 学 校 互 动 
差异 的 四 个 来 源 : 由 固定 效应 解释 的 部 分 [(2) x (4)]、 代 表 小 区 层次 处 理 效 
应 在 学 校 之 间 随 机 变化 的 部 分 [ (2) x (5)] 、 代 表 学 校 层次 处 理 效应 在 小 区 之 
间 随 机 变化 的 部 分 [ (4) x (3)] 以 及 交互 单元 之 间 与 各 种 处 理 效应 不 相关 的 残 
差 部 分 [ (3) x (5) ] 。 

对 于 交互 矩阵 各 单元 中 学 生 之 间 的 差异 ， 也 可 以 建立 类 似 的 表格 来 给 出 。 
这 个 表格 应 该 显示 ， 学 生 层 次 的 差异 由 几 个 部 分 解释 ， 包 括 : 学 生 协 变量 的 固定 
效应 ; 这 些 协 变量 与 表 12. 4 中 学 校 、 小 区 以 及 学 校 一 小 区 互动 之 间 各 自 的 互动 ; 
还 有 与 学 生 协 变量 及 其 和 任何 其 他 部 分 互动 无 关 的 交互 组 内 的 残 差 部 分 。 
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表 12.4 层 -1 系 数 差异 的 来 源 { 根据 方程 12. 13) 





XFN HRE 自由 度 
rs) a o a 1 
(2) 小 区 效应 YW, 1 
(3) 未 解释 的 小 区 效应 bo; J-2=4 
(4) 学 校 效 应 BX, 1 
(5) 未 解释 的 学 校 效 应 ca K-2=2 
(2) x(4) 6,X,¥, 1 
(2) x(5) Cpt Fy K-2=2 
(4) x(3) bX J-2=4 
(3) x (5) dya (J-2)( K-2) =8 
总 计 JK =24 





一 个 完全 的 组 合 模型 。 将 层 -2 模型 (方程 12.13) 代入 层 -1 模型 (F 
各 12.9) 将 产生 一 个 组 合 的 “混合 模型 ”方程 : 


Ya = Oo + Oay + ByX, + yoW, + 6¥, x W, + BX, X ay 
+ YW Xay + 8X, XW, Kay + by, X, + Coun, [12.14] 
| 

+ by X Oy + Cy Xaa t dy X ay + bX, Kay + cnW, X ag 


+ bey + Coos + doy + Cy 


两 个 主要 评语 : 

1. 尽管 只 有 两 个 交互 分 类 的 因素 ， 并 且 在 每 一 层次 (学 生 、 学 校 以 及 小 
K) 中 只 有 一 个 协 变量 ， 差 异 的 来 源 已 经 非常 多 了 ， 而 且 相 应 模型 还 有 广泛 
的 扩展 可 能 性 。 当 增加 交互 分 类 因素 (比如 时 间 )、 加 入 嵌 套 因素 (如 校区 ) 
以 及 加 和 人 更 多 协 变量 的 时 候 ， 模 型 会 极 快 地 扩展 。 

2 由 于 模型 会 迅速 复杂 化 ， 并 且 任何 一 个 研究 数据 都 不 能 在 每 个 层次 上 
过 于 宽泛 ， 所 以 我 们 需要 遵守 简约 性 原则 。 也 就 是 说 ， 要 尽 可 能 地 将 一 些 协 变 
量 定义 为 不 含 随机 效应 ， 至 少 不 要 每 一 层 都 有 协 变量 含 随机 效应 ， 因 为 经 常 由 
于 交互 组 规模 不 够 充分 而 不 能 估计 随机 的 行 、 列 交互 效应 。 的 确 ， 如 果 表 
12. 3 中 的 数据 不 对 随机 效应 的 协 方差 结构 加 以 限制 的 话 ， 便 不 可 能 估计 方程 
12. 14 中 的 完全 模型 。 施 加 限制 以 简化 模型 时 最 好 要 根据 有 关 理论 来 进行 。 后 
面 两 个 例子 所 示范 的 一 些 限制 方法 ， 虽 然 得 以 取得 差异 存在 的 一 些 简单 结果 ， 
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但 会 受到 现 有 理论 的 非议 。 


例 1: 苏格兰 教育 成 绩 中 的 邻里 效应 与 学 校 效应 


这 一 研究 设计 以 前 在 表 12. ! 中 描述 过 ， 表 12. 5 提供 了 有 关 描 述 性 统计 。 
数据 中 有 2310 E, DIRE F 524 小 区 和 17 所 学 校 。 结 果 变 量 是 总 成 绩 
(平均 数 m =0. 116， 标 准 差 sd =1.00)， 它 是 在 苏格兰 高 中 后 期 学 生 的 一 系列 
全 国 性 考试 基础 上 建立 起 来 的 合成 测量 。 这 些 考试 成 绩 对 于 学 生 未 来 就 业 和 升 
和 人 大 学 有 很 大 影响 - 协 变量 中 包括 : 小 学 7 年 级 的 口头 论证 分 (Primary 7 
VRQ; 平均 值 为 0.51， 标 准 差 为 10.65)， 小 学 7 年 级 的 阅读 分 (Primary 7 
reading， 平 均值 为 - 0.04， 标准 差 为 13. 89) ， 以 及 一 些 社会 人 口 指 标 ， 包 括 
父亲 的 就 业 状况 及 其 职业 以 及 父母 的 教育 程度 。 表 12.5 显示 出 ， 只 有 22% 的 
父亲 和 25% 的 母亲 15 岁 以 后 仍然 在 校 学 习 ，11% 的 父亲 处 于 失业 状态 。 最 重 
要 的 一 个 自 变 量 是 教育 当局 所 辖 的 每 一 选区 (与 美国 的 普查 区 类 似 ) 中 关于 
小 区 社会 剥夺 《social deprivation) 的 由 20 项 指标 合成 的 自 变量 。 这 一 量度 综 
合 了 贫困 集中 度 、 健 康 、 本 社区 住房 存量 等 信息 ， 平 均值 为 0.04， 标 准 差 为 
0.62 (细节 请 参阅 Gamer & Raudenbush, 1991). 


表 12.5 苏格兰 小 区 研究 的 描述 性 统计 





变 Mo RH 平均 值 标准 差 
(a) 社区 层次 oO = : 
HERF (DEPRIVATION) 524 0.04 0. 62 
(b) ** BER 
总 成 绩 2310 0.09 1.00 
小 学 7 年 级 的 口头 论证 分 (VRQ) 2310 0.51 10. 65 
小 学 7 年 级 的 阅读 分 (READING ) 2310 -0.04 13. 89 
父亲 职业 (DAD OCC) 2310 -0.46 11.78 
父亲 教育 (DAD ED) 
(45 岁 后 仍 在 校 学 习 =1， 否 则 =0) 2310 0.22 0.41 
母亲 教育 (MOM ED) 
OS 岁 后 仍 在 校 学 习 =1， 再 则 =0) 2310 0. 25 0.43 
父亲 失业 状况 (DAD UNEMP) 
(Kak =1, AM) =0) 2310 0.11 0.30 


性 别 (SEX) (男生 =1, 女生 =0) 2310 0. 48 0. 50 
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无 条 件 模型 


让 我 们 先 考虑 用 一 个 无 条 件 模型 来 进行 方差 分 解 。 在 层 -1， 我 们 有: 


Ya = toy +eu， ea ~ N(O,o*) [12.15] 


JOP, REEDE j AE BE k WFE iR mak APW”, BEHE 
于 小 区 /并 就 学 于 学 校 上 的 所 有 学 生 的 平均 成 绩 ; Mo 是 交互 组 内 的 方差 。 

在 层 -2， 我 们 仅 考 虑 一 个 “ 主 效应 模型 "。 也 就 是 说 ， 由 于 单元 规模 太 
小 以 至 于 不 能 可 靠 地 区 分 小 区 一 学 校 互 动 的 随机 效应 与 单元 内 误差 ， 因 此 我 们 
省 略 了 这 一 交互 随机 效应 。 于 是 ， 我 们 有 : 


Ton = Oa + boo; + cas [12.16] 


bm ~ N(O,7,0), Con ~ N(0,roo) 
这 一 分 析 (其 结果 在 表 12.6 的 模型 1 部 分 ) 使 我 们 能 够 估计 三 种 有 趣 的 组 内 
相关 。 小 区 内 相关 是 居住 于 同一 小 区 但 在 不 同学 校 上 学 的 两 个 学 生 之 间 结 果 的 
相关 。 其 估计 值 为 ; 
cor Vig Veg) = — 
Tm + Te to [12.17] 
0. 141 
= 0.141 + 0.075 + 0.799 
也 就 是 说 ， 总 方差 中 13.9% 是 小 区 之 间 的 方差 。 与 此 类 似 ， 学 校内 相关 是 就 
学 于 同一 学 校 而 居住 于 不 同 小 区 的 两 个 学 生 结果 上 的 相关 : 


= 0. 139 


— 7 
corr( ys Yin) = = EJE 77 
— * [12. 18] 


5 
~ 0.141 +0.075 +0.799 — 


也 就 是 说 ，7. 4% 的 方差 存在 于 学 校 之 间 。 最 后 ， “单元 内 ”相关 是 居住 于 同 
一 小 区 并 就 学 于 同一 学 校 的 两 个 学 生 在 成 绩 上 的 相关 : 


0.074 


Cr = DAC 
Tio + Ton tO [12.19] 
0.141 + 0.075 


= 0.141 +0075 + 0,799 = 0212 
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于 是 ， 根 据 拟 合 模型 ，22% 的 方差 存在 于 交互 单元 之 间 。 注 意 ,方程 12.4 的 
7so 并 不 出 现 于 方程 12. 19 中 ， 因 为 主 效应 模型 假定 rm =0。 


R126 苏格兰 小 区 数据 的 模型 分 析 结果 





模型 3; 

模型 1: 模型 2: 
(a) PA at Rey 定义 社会 剥夺 为 随 

无 条 件 模 型 条 件 模型 机 效应 的 条 件 模型 
AZE 系数 s + 比率 系数 æ itë 系数 s itg 
RE ~ 0.075 0.072 — 0.100 0.021 — 0,098 0.021 一 
口头 论证 分 (VRQ) 0.028 0.002 11.59 0.028 0.002 12.21 
阅读 分 (READING) 0.026 0.002 14.68 0.026 0.002 14.99 
父亲 职业 (DAD OCC) 0.008 0.001 5.80 0.008 0,001 5.96 
父亲 教育 (DAD ED) 0.144 0.041 3.54 0.142 0.041 3.50 
母亲 教育 (MOM ED) 0.059 0.038 1.59 0.060 0.037 1.63 
父亲 失业 状况 (DAD UNEMP) -0.121 0.047 -2.58 -0.120 0.047 -2.57 
性 别 (SEX) -0.056 0.028 -1.97 -0.056 0,028 -1.98 
22% (DEPRIVATION) -0.157 0.025 -6.22 -0.159 0.027 -5.94 


(b) 方差 分 量 参 数 估计 估计 估计 
i 
小 区 





Var( bwj) = Tio 0. 141 0. 000 0. 004 
+R 
( Var( coo, ) —— d 
Cov( coia sco) Varl con) — ons pie 0. 002 
ig Ka | 0.002 0,001 
Tao Ten 
学 生 
Varley do? 0.799 0. 459 0. 455 
模型 自由 度 df 4 12 14 
条 件 模型 


Gamer 和 Raudenbush (1991) 在 非 实验 性 数据 条 件 下 探索 了 对 小 区 社会 
剥夺 前 弱 了 教育 成 果 这 一 假设 的 严格 检验 ， 所 得 到 的 是 两 个 关于 认 知 能 力 的 重 
要 指标 ， 即 口头 论证 分 (VRQ) 和 阅读 分 (READING)， 二 者 都 是 在 小 学 7 年 
级 即将 进入 高 中 前 测量 的 ( 参见 表 12.5) 。 这 两 个 指标 提供 了 关于 学 生 语言 能 
力 的 重要 信息 。 这 样 一 来 ， 控 制 了 这 些 协 变量 ， 实 际 上 便 是 在 小 学 阶段 结束 时 
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清除 了 以 入 小 区 对 语言 能 力 的 任何 影响 。 另 外 将 一 些 人 口 背 景 变量 也 加 入 模型 
作为 层 -1 自 变量 ， 于 是 这 个 模型 为 : 
Yu = To + my (VRQ), + wy (READING), 
+ mal DAD OCC), + m,a (DAD ED); en 
+ mu (MOM ED), + m, (DAD UNEMP) „ 


+ ma (SEX) y + ey 


这 里 ， 所 有 的 层 -1 自 变量 都 是 以 总 平均 数 对 中 的 ， 并 且 单 元 内 的 残 差 方 差 为 
Var(en) = os 


估计 截 距 的 层 -2 模型 为 ; 


Toa = b+yo(DEPRIVATION)，+ big, + Coos (12. 21] 


为 了 简约 (给 定 的 单元 规模 和 小 区 内 的 样本 规模 都 很 小 ) 起 见 ， 所 有 其 他 的 
层 -1 系数 都 是 固定 的 : 


Ta = 8, p>o (12. 22) 


这 些 结果 ( 表 12.6 中 模型 2 部 分 ) 有 几 个 明显 的 特点 : 


* 几 个 层 -1 协 变量 都 与 学 习 成 绩 显著 相关 ， 特 别 是 对 阅读 分 ( READ- 
ING) 和 口头 论证 分 (VRQ) 有 很 大 影响 。 

* 层 -1 残 差 方差 估计 为 0. 459， 表 明 无 条 件 层 -1 方差 (估计 为 0.799) 
中 有 46% 被 这 些 协 变量 所 解 妓 。 

。 在 控制 了 这 些 层 - 1 效应 以 后 ， 社 会 剥夺 出 现 了 高 度 显著 的 负 效 应 
(7= -0. 157, t= -5.94)。 

© 小 区 之 间 的 残 差 变 化 rw。( 估计 为 0.000) 和 学 校 之 间 的 残 差 变化 rm 
(估计 为 0.004) 都 很 接近 于 0。 与 无 条 件 的 方差 估计 相 比 (0. 141 与 
0. 075) ， 这 些 层 -2 方差 分 量 被 大 大 削减 了 。 


估计 社会 旭 夺 的 随机 效应 


在 刚刚 完成 的 分 析 中 ， 小 区 社会 剥夺 与 成 绩 之 间 的 关系 被 假定 为 在 学 校 之 
间 不 变 。 我 们 很 想 检验 这 一 假定 。 此 外 ， 如 果 这 种 联系 的 确 在 学 校 之 间 发 生变 
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化 ， 当 这 种 联系 被 假定 为 在 学 校 间 固定 时 ， 就 会 低估 标准 误 。 因 此 ， 我 们 将 方 
程 12.21 扩展 为 : 


Tox = Oy + (Yo) + Coa) (DEPRIVATION), + bow + com 


Hp: 


saa Le (2,7) 


Con Tano To 


FE, Cy ER AM DRM RAZR R ER RA TB 
Tol， 并 且 它 还 与 学 校 的 随机 效应 co, HEE 
但 是 ， 拟 合 模型 没有 提供 剥夺 效应 在 学 校 间 变 化 的 证 据 。 其 点 估计 为 : 


if =] i e 

* E 0. 001 
产生 的 模型 偏差 度 为 4768. S1。 而 定义 剥夺 存在 固定 效应 的 模型 ( 表 12.6 中 
模型 2 部 分 ) 的 偏差 度 为 4769. 60， 两 者 之 间 的 差距 为 4769. 60 - 4768. 51 = 
1.09。 将 这 一 差距 与 自由 度 为 2 的 Xx 分 布 的 百 分 位 点 比较 后 ， 决 策 是 要 接受 
虚无 假设 ro Toa =0。 这 并 不 奇怪 ， 如 同 所 有 关于 固定 效应 的 推断 一 样 ， 
社会 剥夺 效应 Y01 的 标准 误 几 乎 保持 不 变 。 


例 2: 儿童 在 小 学 阶段 认 知 能 力 增长 中 的 班级 效应 


第 8 章 介绍 了 应 用 三 层 模 型 对 个 人 成 绩 增 长 的 情景 效应 进行 估计 。 所 用 例 
子 中 涉及 对 柚 套 于 学 校 的 学 生 进行 重复 测量 ， 最 后 得 到 在 学 生 学 习 成 绩 上 的 学 
校 差异 的 推断 。 其 他 的 例子 还 包括 ， 柑 套 于 主治 大 夫 的 病人 的 痉 傅 过程 ， 以 及 
在 社区 中 ， 在 青少年 阶段 犯罪 倾向 变化 上 的 影响 ( Raudenbush，1995 ) 。 三 层 
的 分 层 模型 在 估计 个 人 变化 上 的 这 种 情景 效应 时 存在 着 局 限 ， 即 这 种 模型 只 能 
应 用 于 那些 在 研究 时 段 中 一 直 处 于 单一 情景 的 个 人 。 如 果 这 些 人 在 研究 中 跨越 
了 情景 边界 ， 那 么 数据 就 不 再 具有 杠 套 结构 。 然 而 ， 这 种 结构 涉及 个 人 按 社会 
场所 的 交互 分 类 。 

如 同 表 12.7 中 的 数据 所 示 ， 在 研究 班级 对 小 学 学 生 认 知 能 力 增长 的 影响 
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时 ， 便 会 发 生 这 种 转移 。 这 一 数据 来 自沉 浸 研 究 (Ramirez et al. , 1991) 的 子 
样本 ， 上 述 研 究 要 对 为 美国 的 英语 较 差 的 儿童 举办 的 不 同 项 目 进 行 全 国 性 评 
价 ， 这 个 例子 请 参见 Raudenbush (1993) ， 但 是 在 这 里 我 们 要 用 累计 效应 模型 
来 做 ， 因 此 它 还 是 新 的 内 容 。 表 12.7 中 的 每 一 行 代表 一 个 儿童 ， 每 一 列 代表 
一 个 老师 。 为 了 简洁 起 见 ， 只 列 出 了 所 有 此 童 的 前 10 名 与 后 10 名 。 用 5009 
号 和 5010 号 两 个 儿童 的 历史 来 说 明 在 小 学 的 社会 成 员 属 性 的 变迁 : 在 一 年 级 
这 些 儿童 都 在 10 号 教师 的 班 ， 但 是 在 二 年 级 他 们 便 分 开 了 ， 儿 童 5009 被 分 配 
给 17 号 教师 ， 而 儿童 5010 被 分 配给 11 号 教师 。 在 二 年 级 ，5009 号 儿童 第 一 
次 成 了 5011 号 儿童 的 同学 ， 现 在 他 们 有 共同 的 17 号 教师 。 


表 12.7 从 沉 漫 研究 抽出 的 子 样本 的 数据 组 织 结构 : 每 个 X 代表 一 个 观察 
年 级 -年 级 二 年 级 三 年 级 四 年 级 
教师 1 2:3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 合计 











w 
= 
Ss 
= 
‘eRe wre ewe DD 


5237 x x x x 4 
5238 x x x 3 
5241 X 1 
5242 x x 2 
5243 x x 2 
5245 x x 2 
5246 x x x x 4 
合计 513151814151313107 2 9 101113 4 6 1511 12123 3 2 012 1 250 
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层 = 1 模型 9 假设 每 一 个 学 生 在 小 学 时 的 数学 知识 水 平 为 直线 增长 (根据 
检查 残 差 标 绘图 ， 说 明 这 一 假设 是 合理 的 ) : 


Ya = Toa + Windy + ae ea ~ N(0,0°) [12.23] 
Hp: r 
六 是 班级 上 的 儿童 j 在 时 间 i 上 的 数学 知识 水 平 ，; 
在 一 、 二 、 三 、 四 年 级 时 分 别 取 值 为 0、!1 、2、3; FE, 


Toa FE JLI j 在 一 年 级 时 的 期 望 数学 知识 水 平 ; 
zi 是 儿童 ;在 数学 知识 上 的 年 增长 率 ; 
enn 是 同一 对 象 的 随机 残 差 ， 假 定 其 服从 平均 信 为 0、 方差 为 r 的 正 态 分 布 。 


在 层 -2， 我 们 先 定义 一 个 无 条 件 模型 ， 并 省 略 与 单元 相 联系 的 随机 交互 
效应 。 由 于 每 个 单元 最 多 只 有 一 次 观测 (在 特定 班级 中 没有 人 被 观测 多 于 一 
次 )， 因 此 不 可 能 从 单元 内 方差 中 分 解 出 学 生 一 班级 方差 。 我 们 将 教师 对 学 生 
数学 知识 水 平 增长 的 影响 看 作 是 对 每 个 学 生 的 特定 增长 轨迹 的 “偏转 ”作用 ， 
或 是 正 的 ， 或 是 负 的。 

展现 的 交互 分 类 模型 现在 产生 了 一 个 问题 。 假 如 将 co, BE YE HE h FAM 
师 上 而 产生 的 “偏转 ”， 那 么 学 生 j 的 轨迹 就 可 以 由 下 列 简单 模型 来 描述 : 


Toa = Oo + bo + Coos 


Ta =O + by 


eja =] 


Coon ~ NCO, To) 


(12. 24} 


sop, 
0, 是 一 年 级 的 平均 数学 水 平 ; 
6, 是 一 年 级 的 平均 学 习 率 ; 
bw 是 学 生 j 在 一 年 级 学 习 中 的 随机 效应 ; 
bw 是 学 生 j 在 一 年 级 数学 的 学 习 率 上 的 随机 效应 ; 
cont 是 教师 随机 效应 ， 即 当 过 到 教师 时 增长 曲线 上 的 期 望 偏转 。 


D BR SBS 章 的 标注 保持 一 致 ， 我 们 可 以 将 儿童 i 在 时 间 : 过 到 教师 7 的 模型 方程 写 为 了 = oy + 
Tuaw +ew。 但 是 ， 我 们 在 方程 12.23 中 的 标注 形式 是 为 了 强调 保持 与 本 章 第 一 个 例子 的 连续 性 。 
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这 里 的 符号 rwoo 表示 bw 与 biw 之 间 的 协 方差 。 可 想 而 知 ， 一 个 学 生 在 一 
年 级 的 水 平 与 其 增长 率 相 关 。 

这 个 模型 所 产生 的 问题 是 ,教师 的 影响 将 在 每 年 的 年 未 消失 。 为 了 说 明 其 
缘故 ， 我 们 来 想像 一 个 假设 情况 : 学 生 j 在 一 年 级 时 过 到 教师 1， 在 二 年 级 时 
过 到 教师 2， 在 三 年 级 时 遇 到 教师 3。 在 给 定 这 个 学 生 的 增长 参数 和 这 些 教师 
效应 的 条 件 下 ， 这 个 学 生 的 预测 值 为 : 

一 年 级 的 预测 值 :了 ,= 6, + bow + col 

二 年 级 的 预测 值 ; Pii = By + boo, + Coos +O, + Bio, 

三 年 级 的 预测 值 ， fs = 0, + bow +c +200, +b) 

这 里 ， 从 一 年 级 到 二 年 级 的 增 量 为 9, + bo + co - coo; 从 二 年 级 到 三 年 级 
的 预测 增 量 为 9, + biw + co -cos。 所 以 ， 更 适当 的 模型 应 该 定义 的 是 累计 
(cumulative) 的 教师 效应 ， 因 此 其 预测 值 为 ; 

一 年 级 的 预测 值 : 了 ,= 0) + bo + cm 

二 年 级 的 预测 值 : 了 ,, =O + boo +8; + Big; + Coor + Coo 

三 年 级 的 预测 值 ; Y,, = bo + bo +2(0, +b) + co + coor + coo 

现在 ， 从 -- 年 级 到 二 年 级 的 增 量 为 9, + bo + cu; 从 二 年 级 到 三 年 级 的 增 最 
为 0, + bw +co。 对 于 每 一 年 ， 增 量 都 是 学 生 的 增长 率 加 上 一 个 教师 偏转 量 。 

为 了 应 用 这 样 的 累计 效应 ， 我 们 将 层 -1 模型 (方程 12. 23) 重新 写 为 : 


Y, = Woy + Tt +e, e~ N(0,o3) [12.25] 


* 


其 中 ,1=0，1，2，3， 表 示 自 学 生 j 进 和 人 一 年 级 以 来 延续 的 年 数 。 这 个 模型 可 
以 容许 截 距 和 斜率 随时 间 变化 ,但 是 在 当前 的 应 用 分 析 中 只 允许 截 距 随时 间 变 
化 。 在 层 -2， 我 们 有 : 


x t 
To = Oy + bag + 2 — 


Ty =O, + bo, 


人 的 [| = 


Tanowo Tho 


Co ~ N(0, 2a) 


这 里 ， 要 是 学 生 j 在 时 间 h 时 过 到 教师 &， 则 令 Di =1; BMD, =0。 F 
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程 12. 26 中 的 两 重合 计 将 教师 效应 cow 随 着 时 间 “ 累 计 ” 起 来 。 

结果 。 表 12.8 中 比较 了 交互 随机 效应 模型 (其 中 包括 了 累计 教师 效应 co ) 
与 标准 的 两 层 增 长 模型 ( 参见 第 6 章 ， 其 中 忽略 了 学 生 聚 集 于 班级 的 情况 ) 。 忽 
路 班级 的 两 层 分 层 模型 ( 表 12.8 中 的 模型 1 部 分 ) 与 交互 随机 效应 模型 (R 
12.8 中 的 模型 2 部 分 ) 的 结果 相 比 ， 有 一 些 明显 的 相似 之 处 。 两 者 在 初始 状况 
上 的 估计 (一 年 级 的 数学 水 平 ) 几乎 一 样 (256.58 相 比 256. 60) 。 两 个 模型 估计 
的 平均 增长 率 (每 年 47.11 分 相 比 每 年 47. 13 分 ) 也 很 近似 ， 这 一 情况 表明 学 
生 的 数学 知识 水 平 以 相当 快 的 速度 增长 (在 4 年 学 习 中 平均 每 年 约 为 一 个 
标准 差 ) 。 


R128 沉浸 研究 数据 的 模型 分 析 结果 








Rg 模型 1: 模型 2: 模型 3; 

VATRE 忽略 班级 方差 估计 班级 方差 预测 班级 方差 
自 变量 系数 s :比率 系数 sr :比率 系数 se 1 比率 
-ERIMGA 256.58 251 — 25660 4.00 — 251.62 S08 — 
线性 增长 率 的 期 户 什 47.11 2.22 21.19 47.13 3.53 13.36 41.39 5.22 7.94 
教师 硕士 学 位 的 效应 7.64 5.45 1.40 
(b) 方差 分 最 参数 thit 估计 tiit 
* — J — 
PRR Var( bo) = Tuo 478.74 398, 27 395, 65 
增长 率 Varf by) = rho 122.72 128. 01 125.01 
初始 状况 与 增长 事 的 协 方 卷 

atika baki tai 35. 85 75.90 79, 24 
教师 效应 Var( cog) = rm 106. 16 81.97 
RBH Var(e,) = o, 329. 06 273.07 278. 62 
模型 偏差 统计 量 2332. 09 2295. 75 2294. 01 
MA hE df 6 i 8 


然而 ， 两 个 模型 的 结果 中 同样 也 存在 着 差别 。 模 型 2 估计 的 教师 效应 的 方 
差 7 =106. 16 伴随 着 学 生 之 间 在 截 距 方差 估计 上 的 减少 (模型 2 的 fu = 
398. 27 对 比 模型 1 的 7m =478.74)。 这 样 ， 本 来 被 归 因 于 个 人 差异 的 部 分 变 
异 现在 被 归 因为 班级 经 历 的 作用 。 此 外 ,学 生 内 部 的 方差 也 减少 了 (6 = 
273. 07 相 比 329. 06) ， 说 明 在 模型 | 中 被 归于 时 间 方 面 不 稳定 性 的 部 分 变异 被 
模型 2 的 班级 经 历 所 解释 。 我 们 注意 到 ， 在 交互 分 类 模型 中 能 够 被 教师 偏转 作 
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用 所 解释 的 方差 在 两 层 分 层 模型 中 被 当 作 “学 生 内 部 ”变异 的 部 分 ， 现 在 却 
与 教师 联系 起 来 了 

为 了 检验 班级 效应 的 统计 显著 性 ， 先 要 比较 模型 1 和 模型 2 的 拟 合 情 况 ， 
得 到 在 偏差 度 上 的 差距 2332. 09 - 2295. 75 = 36. 34 ， 然 后 再 将 其 与 自由 度 等 
于 1 的 x 临界 值 相 比 ， 最 后 的 结果 使 我 们 在 p <0.001 的 水 平 上 拒绝 虚无 假设 
Hu:ro =0。 

我 们 如 何 来 解释 班级 效应 的 规模 呢 ? 对 其 所 估计 的 方差 rm = 106. 16 等 价 于 
标准 差 V106. 06 =10.30。 现 在 有 平均 增长 率 为 47. 13， 因 此 一 个 班 在 给 定年 份 的 
期 望 知识 增 量 要 是 高 于 平均 水 平一 个 标准 差 便 是 47. 13 + 10. 30 =57.43， 而 一 个 
班 在 给 定年 份 的 期 望 知识 增 重 比 平均 水 平 低 一 个 标准 差 便 是 36. 83。 这 看 起 来 是 
个 不 小 的 差别 了 ， 尤其 是 它 还 要 与 运气 好 坏 结合 起 来 发 生 作 用 ， 即 可 能 过 到 的 教 
师 的 好 与 不 好 还 有 多 种 可 能 性 。 另 一 种 测量 班级 效应 幅度 的 方法 是 将 其 方差 与 个 
人 层次 增长 差异 的 方差 进行 比较 。 我 们 计算 出 rm/rue = 106. 16/128.01 =0. 83。 
于 是 ， 就 能 估计 出 班级 的 贡献 大 约 相 当 于 每 年 知识 增 量 的 方差 中 属于 个 人 那 部 分 
的 83% ， 这 看 起 来 也 是 相当 大 了 。 

条 件 层 -2 模型 。 为 了 示范 对 教师 效应 建立 模型 的 过 程 ， 我 们 现在 将 
层 -2 模型 进行 扩展 ， 将 教师 的 研究 生 学 位 〈Degree) 作为 一 个 协 变量 : 


K G 
Top = On + bo + > F Dul Bo (Degree), + Coe, } 
ded bed 


Ty = 8, + bw 


——505 


其 中 ， 在 教师 上 有 硕士 学 位 时 (Degree), =1, Ml (Degree), =0, Wit, By 
成 为 有 无 硕士 学 位 的 教师 之 间 在 教师 效应 上 的 调整 的 平均 差异 ， 而 cw 是 在 控 
制 教师 的 研究 生 学 位 条 件 下 教师 上 的 残 差 效应 。 将 教师 的 研究 生 学 位 加 入 模型 
以 后 〈 表 12. 8 中 的 模型 3) ， 导 致 教师 层次 的 方差 分 量 rw 从 106. 16 减少 到 
81.97。 教 师 受 教育 状况 的 效应 也 与 所 期 望 的 方向 相同 ，B,, =7. 64， 但 是 在 两 
种 检验 上 都 没 能 达到 常规 显著 性 水 平 : 一 种 是 这 一 系数 与 其 标准 误 的 比值 ， 
4=1.40; 另 一 种 是 比较 模型 2 和 模型 3 各 自 的 拟 合 程度 ， 得 到 偏差 度 之 间 的 
差 为 2295. 75 -2294. 01 =1. 74 ， 相 应 的 自由 度 等 于 1。 ` 
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小 结 


当 每 一 较 低 层次 的 单位 〈 如 学 生 ) 只 属于 某 一 个 上 一 层 单位 〈 如 班级 ) ， 
而 这 上 一 层 单位 仍然 只 属于 一 个 更 上 一 层 的 单位 (如 学 校 ) 时 ， 便 产生 了 纯 
粹 的 报 套 结构 。 交 互 分 类 的 情况 涉及 更 复杂 的 堪 套 结构 。 当 较 低层 次 的 单位 
(如 学 生 ) 同时 既 属 于 某 一 个 因素 中 的 一 个 单位 (如 某 个 小 区 )， 又 属于 第 二 
个 因素 中 的 一 个 单位 ( 如 某 个 学 校 ) 时 ， 交 互 分 类 便 产 生 了 。 本 章 介绍 了 双 
因素 的 交互 分 类 模型 ， 其 中 层 - 1 单位 嵌 套 于 按 两 个 上 一 层 因素 交互 分 类 的 
“单元 "， 并 且 上 层 中 的 因素 被 视 为 随机 的 ， 而 不 是 固定 的 。 为 了 便于 解释 
我 们 将 上 层 的 两 个 因素 称 为 “ 行 ”和 “ 列 "。 双 因素 交互 分 类 模型 开始 于 一 个 
层 -1 模型， 或 称 之 为 “单元 内 部 ”模型 。 层 -1 系数 可 以 在 行 之 间 、 列 之 间 
以 及 单元 之 间 变 化 ， 其 中 一 部 分 变化 是 作为 行 、 列 、 单 元 上 所 定义 的 自 变量 的 
函数 发 生 的 。 所 定义 的 行 自 变量 的 效应 可 以 在 各 列 之 间 随 机 变化 ， 而 所 定义 的 
列 自 变量 的 效应 可 以 在 各 行 之 间 随 机 变化 。 


本 章 术语 概要 


双 因素 交互 分 类 数据 : 涉及 将 各 个 基本 观察 或 称 为 “案例 ”分 类 到 有 J 
行 和 大 列 的 矩阵 中 去 。 

交互 分 类 的 随机 效应 模型 : 将 双 因 素 交互 分 类 数据 中 的 与 行 和 列 相 联系 的 
效应 视 为 随机 的 ， 也 就 是 说 ， 是 从 一 个 可 能 效应 分 布 中 的 抽样 。 

层 -1 或 “单元 内 部 ”模型 : 描述 了 在 双 因 素 交 互 分 类 的 随机 效应 模型 
中 ， 同 一 单元 中 所 有 观察 在 结果 上 的 差异 来 源 : 


2 
Ya = To + Vans + en ey ~ N(0,0°) 
est 


层 -1 结果 为 yu ， 即 在 双 因 素 和 矩阵 中 与 第 / 17 kU EO i RB 
的 结果 变量 了 的 值 ， 其 中 : 

在 单元 让 中 有 ;=1，…，m 个 案例 ; 

有 ji =1，…，J/ 行 ; 

H k=1, =, KB 
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层 -1 的 自 变量 为 am，pP=1，…，P。 
层 -1 的 系数 为 mw, p=0, 0, Po 
层 -1 的 随机 效应 为 en- 

层 -1 方差 或 称 “单元 内 部 ”方差 为 oo。 
层 -1 系数 rw 是 层 -2 的 结果 变量 。 

层 -2 或 单元 之 间 的 模型 为 ， 


mm = 0, + D (Byy + bn) Xm 


+ Ty +t) Ws + Di 

ee 
具体 列 的 自 变量 为 X ,9 =1,…,，0。 
具体 行 的 自 变量 为 W,,, rsl, =, R 


具体 单元 的 自 变量 为 Zua s=l, sey 5. 
具体 列 的 自 变量 有 固定 效应 B,， 但 也 可 以 有 在 各 行 /= 1，…，J 随机 变化 


的 效应 js 


具体 行 的 自 变量 有 固定 效应 y*， 但 也 可 以 有 在 各 列 上 =1，…, K 随机 变 


化 的 效应 cwie 


具体 单元 的 自 变量 有 固定 效应 5,,。 
在 模型 考虑 了 所 有 行 和 列 的 协 变量 的 影响 以 后 ， 行 随机 效应 bmw、 列 随机 


效应 co 、 具 体 单元 随机 效应 di 都 对 层 -2 结果 mx 有 独立 的 贡献 。 


方差 协 方差 分 量 中 包括 ; 
1. 所 定义 的 行 间 方差 与 协 方差 


Var(b) = Tw0 ovl by By) = Fay pg 
2. 所 定义 的 列 间 方差 与 协 方差 

Var(cm) = Faqs.) corie ,cn) = Tony 
3. 所 定义 的 单元 上 的 方差 与 协 方差 

Var(da) = Taps COV diy sdyy) = Typ 


KAAMEA HS BR BE Be A SH eh IE OP a BAT, R 


计 效 应 模型 可 以 恰当 地 描述 社会 处 境 的 贡献 。 


AF 
分 层 模型 的 贝 叶 斯 推断 


© 贝 叶 斯 推断 的 导论 

。 例子 ; 正 态 均值 的 推断 

© 贝 叶 斯 视角 下 的 分 层 线性 模型 

© HAR HLM 的 贝 叶 斯 推断 基础 

日 例子 : 贝 叶 斯 与 经 验 贝 叶 斯 的 元 分 析 
© 吉 布 斯 抽样 以 及 其 他 计算 方法 

本 章 术 语 概 要 


通过 对 这 本 书 的 学 习 ， 我 们 的 兴趣 聚焦 于 三 种 类 型 的 数量 ; 随机 变化 
的 回归 系数 、 固 定 的 回归 系数 ， 以 及 方差 协 方差 的 成 分 。 我 们 的 推断 方法 
的 基础 建立 在 最 大 似 然 估计 和 经 验 贝 叶 斯 的 结合 之 上 。 正 如 我 们 在 第 9 章 
中 讨论 过 的 那样 ， 当 高 层 单位 的 数量 很 大 时 ， 这 种 方法 的 效果 很 好 。 再 
者 ， 甚 至 当 高 层 单位 的 数量 较 小 时 ， 只 要 数据 不 是 太 不 平衡 ， 或 者 研究 人 
员 的 兴趣 主要 在 于 固定 的 回归 系数 或 方差 协 方 差 ， 这 种 方法 依然 相当 
稳健 。 

然而 ， 在 一 些 应 用 中 这 些 条 件 将 不 能 成 立 。 高 层 单位 的 数量 或 许 很 
小 ， 并 且 数 据 可 能 不 平衡 。 在 这 种 情况 下 , “完全 贝 叶 斯 方法 ”就 出 “经 
验 贝 叶 斯 方法 ”有 明显 的 优越 性 。 本 章 的 目的 就 是 阐明 完全 贝 叶 斯 方法 在 
分 层 结构 数据 中 应 用 的 原理 。 我们 用 一 些 示 例 展示 完全 贝 叶 斯 方法 在 什么 
时 候 以 及 为 什么 更 优越 。 
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呈 然 由 叶 斯 方法 的 应 用 变 得 越 来 越 普 忆 ， 但 许多 做 定量 分 析 的 社会 学 家 尚 
未 理解 只 时 斯 方法 的 逻辑 。 这 也 难怪 ， 因 为 传统 的 研究 生 课程 并 未 强调 贝 叶 斯 
方法 ， 但 我 们 认为 这 是 必需 的 ， 所 以 本 章 一 开始 先 就 简单 背景 的 单 层 数据 和 非 
常 简单 的 模型 ， 来 介绍 贝 叶 斯 推断 。 接 着 ， 我 们 将 这 个 逻辑 应 用 于 两 层 数据 的 
-个 相对 简单 的 研究 ， 这 将 使 我 们 能 比较 和 对 照 员 叶 斯 方法 与 经 验 贝 叶 斯 方法 
对 方差 成 分 的 估计 ， 或 是 用 完全 的 或 是 用 约束 的 最 大 似 然 法 。 最 后 ， 我 们 考虑 
吉 布 斯 抽样 方法 的 运用 ， 对 更 多 类 型 的 模型 做 贝 叶 斯 推断 。 为 简洁 起 见 ， 我 们 
在 此 处 仅 关注 每 个 层次 的 线性 模型 

对 分 层 线性 模型 的 贝 叶 斯 推断 的 介绍 当然 较为 简洁 ， 我 们 建议 有 兴趣 的 读 
FLE ¥ Seltzer, Wong 和 Bryk (1996), Gelman 等 人 (1995, 特别 参阅 第 5 
章 及 第 13 ~15 章 ) ， 以 及 Carlin 和 Lovis (1996) 等 更 综合 性 的 处 理 . 了 


贝 叶 斯 推断 的 导论 


“个 模型 表达 了 研究 者 当前 对 其 分 析 数 据 的 产生 过 程 的 认识 ， 统 计 分 析 
的 目标 是 对 模型 参数 进行 推断 。 这 些 推断 包括 点 估计 、 区 间 估 计 和 假设 检 
验 。 在 统计 理论 中 有 两 种 巡 然 不 同 的 推断 方法 ， 它 们 对 于 分 层 模型 都 有 特别 
的 意义 。 

首先 ， 是 众所周知 的 “经 典 ” 或 “频数 学 派 ”( frequentist) 方法 。 在 
这 种 传统 中 ， 参 数 被 固定 为 常量 。 研 究 数 据 是 由 这 些 参数 来 刻画 其 特征 的 
总 体 的 一 个 概率 样本 。 特 定 样本 结果 的 概率 就 是 从 这 一 总 体 中 抽出 许多 独 
立 概率 样本 时 所 产生 的 相对 频数 。 重 复 随 机 抽样 规律 便 是 经 典 统计 学 推断 
机 制 的 基础 。 

其 次 ， 贝 叶 斯 方法 与 之 就 大 相 径 庭 了 。 概 率 不 再 被 视 为 重复 抽样 的 相对 频 
数 ; 相反 ， 概 率 量化 了 研究 人 员 自 己 对 一 些 未 知情 况 的 不 确定 性 。 最 让 人 感 兴 
趣 的 未 知情 况 就 是 数据 所 体现 的 分 布 参数 。 贝 叶 斯 方法 视 这 些 参数 也 拥有 自己 
的 概率 分 布 ， 这 些 分 布 描绘 了 研究 人 员 对 于 参数 值 的 不 确定 性 。 

这 些 对 概率 的 不 同 观念 深刻 地 影响 了 经 典 统 计 与 贝 叶 斯 统计 如 何 思考 点 估 
计 、 区 间 估 计 和 假设 检验 ， 


i RAJAB Mike Seltzer 对 本 竟 初 稿 的 许多 有 益 评 论 ， 以 及 允许 我 们 对 他 的 词汇 量 增长 的 研究 数 
A AE UE PT PT o 
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经 典 的 观点 


点 估计 .一 个 点 估计 以 一 个 真实 的 数 代表 对 一 个 未 知 参 数值 的 好 的 猜测 。 
什么 性 质 使 这 个 猜测 就 “好 ” 呢 ” 在 经 典 统 计 学 家 看 来 便 是 取得 它 的 方法 ， 
就 像 众所周知 的 “估计 量 ” 那 样 ， 好 的 方法 指 在 不 断 重 复 抽样 时 其 结果 能 够 
具有 好 的 性 质 。 这 些 性 质 包 括 匹 偏 性 、 一 致 性 和 方差 最 小 性 。 

区 闻 估 计 ，-- 个 区 间 估 计量 阐述 了 未 知 参 数 的 上 下 限 及 未 知 参数 位 于 此 区 
间 之 内 的 相应 唤 信 度 - 区 介 估 计 的 有 效 性 有 赖 于 其 抽样 的 性 质 : 计算 95% BE 
信 区 间 的 规则 是 ， 在 无 限 地 重复 随机 抽取 样本 时 ， 这 一 未 知 参数 被 包含 在 该 区 
间 内 的 情况 的 比例 应 该 达到 95% 。 经典 统 计 不 能 说 明 一 个 未 知 参数 处 于 任意 
一 个 区 则 之 内 的 概率 ， 因 为 这 一 参数 并 不 是 一 个 随机 变量 ， 所 以 不 能 被 揣 予 一 
个 0~1 之 问 的 概率 值 ， 只 能 说 贰 信 区 间 的 计算 方法 使 该 区 间 以 给 定 的 概率 
例如 0.95， 俘 获 未 知 的 周 定 参 数 

假设 检验 。 一 个 检验 统计 量 只 是 为 了 简单 地 评估 : 当 零 假设 为 真 时 ， 这 一 检 
验 在 5% 的 显著 度 标 准 下 有 5% 的 机 会 拒绝 零 假 设 。 经 典 统计 学 家 并 不 是 说 ,“ 零 假 
设 为 真 的 概率 小 于 0.05”。 在 经 典 的 观点 中 ， 零 假设 并 不 是 一 个 随机 事件 ， 并 不 能 
被 赋 子 一 个 概率 。 当 零 假 设 为 真 时 ， 如 果 样 本 结果 以 一 个 小 概率 发 生 ， 我 们 则 倾向 
于 这 样 的 观点 : 零 假 设 是 不 合理 的 ， 并 且 我 们 要 拒绝 它 。 我 们 是 在 零 假 设 条 件 下 谈 
论 一 个 给 定 事件 的 概率 ， 而 并 非 谈 论 这 一 假设 本 身 为 真 的 概率 。 


贝 叶 斯 方法 的 观点 


贝 叶 斯 方法 的 统计 利用 不 同 的 语言 来 描述 点 估计 、 区 间 估 计 和 假设 检验 。 
所 有 的 未 知 参 数 都 被 假设 具有 革 种 概率 分 布 ， 统 计 推 断 也 建立 在 这 个 基础 之 
上 。 一 个 “ 先 验 分布 ” 描 绘 了 研究 人 员 在 任何 新 数据 被 收集 起 来 之 前 的 参数 
的 猜测 (可 能 是 基于 以 往 的 研究 结果 ) 。 一 旦 得 到 了 新 数据 ， 便 根据 这 些 数据 
所 产生 的 “后 验 分 布 ”来 修订 先 验 分 布 ， 而 后 验 分 布 也 就 是 将 新 证 据 与 先 验 
观点 相 结合 的 一 个 参数 分 布 

点 估计 。 按 照 贝 叶 斯 观点 ， 一 个 未 知 参数 的 点 估计 是 这 一 参数 后 验 分 布 中 
心 趋势 的 一 些 指标 ， 主 要 有 该 参数 的 平均 数 、 中 位 数 或 众 数 ， 一 个 “好 ”的 
点 估计 基 可 将 未 知 参 数 与 估计 基 之 间 的 期 望 距 离 最 小 化 。 例 如 ， 一 个 最 小 均 方 
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误差 估计 量 可 以 在 后 验 分 布 的 基础 上 使 这 一 参数 与 其 估计 基 之 问 的 期 望 距 离 的 
a 

区 间 估 计 。 一 个 置信 区 间 ， 对 贝 叶 斯 方法 而 言 经 常 是 指 “ 可 信和 度 (credi- 
bility) KA” (或 “最 高 后 验 密 度 区 间 ”) ， 即 未 知 参数 的 一 个 合理 取 值 范 
Fel? 一 个 贝 叶 斯 可 信 区 间 估 计 精 确定 义 了 参数 处 于 这 一 区 间 的 后 验 概率 。 比 
如 ， 和 研究 人 员 可 以 断定 一 个 未 知 参数 处 于 某 两 个 数 之 间 的 后 验 慨 率 为 0.95。 

假设 检验 、 就 像 经 典 统计 一 样 ， 贝 叶 斯 统计 常常 根据 数据 在 零 假设 和 备 拌 
假设 之 间 进 行 选择 。 然 而 ， 与 经 典 统计 不 同 ， 贝 叶 斯 统计 要 计算 零 假设 的 概率 
值 ， 并 利用 后 验 分 布 来 完成 这 一 计算 。 


例子 : 正 态 均值 的 推断 


假定 Y, 表示 要 去 某 大 学 研究 生 院 的 申请 人 i 的 GRE ( Graduate Record Ex- 
am) 成 绩 。 我 们 的 目的 是 估计 这 所 大 学 申请 者 的 GRE 平均 分 数 彤 ， 并 将 其 平 
均 分 与 全 国 的 平均 分 (比如 500 分 ) 进行 比较 。 为 简明 起 见 ， 假 定 我 们 知道 
了 其 方差 为 RIDERE Y, 独立 地 服从 N(j，o*)， 即 对 于 所 有 申请 者 i = 
1, 2, 0, n, Y, RABH u, HÉA e 的 正 态 分 布 。 


经 典 方法 


点 估计 。 经 典 统计 计算 jn 的 点 估计 皮 为: 
站 = 了 = Dr/ (13.1) 


O EAER., PRE TATE a ſe OL OF Bs, AR RER" ROW, Mk 
BUELH, YATE MHSHE 6 且 其 供 计 量 为 8 时 所 要 支付 的 昼 数 。 例 如 ， 一 个 误差 平方 的 损 
失 函 数 可 能 是 L(8.6) = (8 -6)*。 误 其 平方 的 风险 是 E[ (8 - 6)2 | Y] ， 这 一 风险 已 通过 选择 9 
的 后 验 均值 作为 6 而 最 小 化 了 ， 其 他 的 损失 函数 也 可 以 依照 其 他 的 点 估计 去 定义 。 例 如 ， 为 了 
使 绝对 误差 损失 的 期 饪 ELL(6.6) |Y] = E(18 -61 |Y) 最 小 化 ， 可 选择 后 验 中 位 数 作为 其 点 

计 ， 

2 — REAT- AER “MAL” (confidence interval) 不 同 的 单词 (eredibility inter- 
val) KR PINO Ay ae MEK). ATR, APRA “Orie” 
“时 信和 区间” 
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即 样本 均值 。 可 以 利用 众多 样本 一 再 出 现 的 习性 来 支持 这 个 点 估计 的 合理 性 。 
ERAN, ME) = 六 ， 所 以 估计 基 的 期 望 值 与 未 知 参数 相等 。 它 还 是 有 
效 的 ， 即 在 所 有 的 无 偏 估计 基 中 ， 它 的 方差 Var(w) =0°/n 是 最 小 的 (参见 
Stuart & Ord, 1995). 当然 ， 它 还 具有 一 致 性 { 即 当 不 断 增 加 时 ,x 的 方差 
BFE): lim Var(j) = lima’ /n =0, 

区 闻 估 计 。 经 典 统计 计算 的 95% 置信 区 间 为 : 


95% CHA) = h +1.96' 0/ Vn [13.2] 


并 且 可 以 证 明 这 个 选择 的 合理 性 ， 即 对 于 所 有 重复 抽取 的 随机 样本 ， 利 用 这 个 
公式 计算 出 来 的 区 间 会 俘获 上 的 真 值 的 机 会 占 到 95% 。 

假设 检验 。 检 验 零 假设 Hy mp $500 以 及 相对 的 备 择 假 设 H,: > 500， 经 典 
统计 计算 概率 : 


p = Prob( Y = c | H, 为 真 ) [13.3] 


即 估计 量 了 大 于 等 二 e 的 概率 ; 其 给 定 的 条 件 是 零 假设 为 真 ， 并 且 这 个 统计 值 
用 当前 样本 进行 计算 。 如 果 疡 足够 小 (p < a)， 零 假设 将 被 拒绝 。 这 种 假设 检 
验 的 合理 性 在 于 ， 可 以 证 明 ， 当 有 无 限 多 的 样本 时 ， 如 果 零 假设 为 真 ， 则 估计 
基 了 大 于 等 于 这 个 计算 值 c 的 可 能 性 为 p> a。 这 种 统计 估计 量 的 频率 特征 再 
-次 提供 了 其 他 合理 性 的 证 明 。 


贝 叶 斯 方法 


依照 贝 叶 斯 方法 ， 所 有 关于 的 推断 是 基于 收集 数据 了 后 的 后 验 分 布 。 这 
还 要 求 研究 人 员 明 确 设 定 j 的 某 种 先 验 分 布 。 

先 验 分布 。 假 设 研究 人 员 在 收集 数据 之 前 便 相信 ，y 服从 均值 为 y、 方 差 
为 7 的 正 态 分 布 ， 即 久 .~N(y，7*)。 先 验 均值 y 表明 研究 人 员 此 前 设想 的 
所 处 的 位 置 ， 而 7 反映 了 研究 人 员 对 yz 的 位 置 不 能 确定 。 因 此 ， 如 果 很 
小 ， 那么 研究 人 员 可 以 非常 肯定 就 在 y 附近 。 然 而 如果 7 很 大 ， 研 究 人 
员 就 没有 多 少 信心 确认 万 在 y 附近 。 

后 验 分 市 。 在 数据 了 被 收集 之 后 ， 人 们 就 可 以 根据 贝 叶 斯 定理 计算 后 验 分 
fi p(w | Y): 
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= er) > „SO apte) [13.4] 


用 诸 言 表达 ， 即 : 在 给 定 了 的 条 件 下 , u 的 后 验 分 布 就 是 Y Mp 的 联合 分 布 
PCY ia) 除 以 了 的 边缘 分 布 A(Y) 的 所 得 之 比 。 标 准 的 计算 2 (Lindley & 
Smith, 1972) ÑR, ERE Y ZA a RAAN a. HAA V WEA 
分 布 ， 这 里 : 


，_ na 7+r 7y 
机 
Pr +r , 
{13.5] 
pe 1 
a a 
a a 





点 估计 。 贝 叶 斯 方法 言 欢 选择 后 验 均值 p" 做 jp 的 点 估计 。 这 个 选择 可 以 
使 得 的 真 值 与 其 估计 量 之 间距 离 的 平方 最 小 ( 见 脚 注 2)， 即 


Ef- lr] (13.6) 


在 k=p' 时 达到 最 小 。 让 我 们 再 更 详尽 地 考察 py.* ,> 

第 一 ， 在 方程 13.5 中 ， 我 们 看 到 jp" 是 先 验 均值 y 和 样本 均值 了 的 加 权 平 
均 数 。 如 第 3 章 所 说 ， 一 个 估计 量 的 精度 是 其 方差 的 倒数 。 与 先 验 均值 和 样本 
均值 相连 的 权 数 与 其 各 自 的 精度 成 正比 。 具 体 而 言 ， 先 验 均值 的 精度 是 +，， 
即 其 方差 的 倒数 。 如 果 这 一 先 验 精度 很 大 ， 在 对 真实 均值 的 估计 中 ， 研 究 人 
员 事 先 猜 测 的 y 就 会 享有 加 大 的 权 数 。 与 此 类 似 ， 样 本 均值 的 精度 是 nc， 
即 其 方差 的 倒数 。 当 样本 规模 n 扩大 时 ， 样 本 均值 的 精度 也 随 之 提高 。 

注意 , py 的 后 验 精度 ( 即 其 方差 的 倒数 ) 是 两 个 精度 之 和 ， 先 验 精度 7 
和 样本 均值 的 精度 no “。 很 明显 ， 后 验 精度 nr +r “总 是 大 于 单独 的 样本 均 
值 精度 ， 这 意味 着 ,后 验方 差 永远 不 会 大 于 样本 均值 的 方差 ， 即 (ng + 
— Son, 

第 二 ， 注 意 ， 当 样本 规模 增加 时 ， 贝 叶 斯 后 验 均值 将 收敛 于 经 典 的 估计 量 ， 


T ATIO |) Bon) RE IES AB piu | Y) exp 人 -FEO Ln 


nr] MEHRI. HHH, ETWY plu | Y) empl -tu -u 7V; }; 


2 对 方程 13.6 双关 于 的 一 阶 导数 ， 并 求解 上 =E(y | 了) =p BB, EE N Ahe 
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即 lim (u?) =Y¥, 

第 三， 假定 先 验 精度 几乎 为 零 ， 在 这 种 情况 下 ,+ “也 赵 于 零 (当然 ， 这 
意味 着 原先 关于 u Mi y 的 信念 有 非常 大 的 不 确定 性 )。 这 时 ， 贝 叶 斯 后 验 均 
值 将 与 经 典 估计 量 重合 ， 即 lim (a°) =¥, 

第 四 ， 假 定 研究 者 确实 拥有 有 用 的 先 验 信息 。 比 如 ， 或 许 以 往 研究 已 知 全 
国 的 平均 GRE 成 绩 为 y， 而 各 大 学 (1=1，…, J) 的 均值 几 的 方差 大 约 为 
7*。 在 任 一 大 学 的 数据 缺失 的 情况 下 ， 我 们 倾向 于 猜测 这 所 大 学 的 jy 是 接近 y 
的 。 至 于 多 么 接近 ， 要 由 各 大 学 之 间 的 方差 7, 来 表示 。 由 于 没有 数据 ， 我 
们 的 后 验 估 订 将 等 于 先 验 估计 。 然 而 ， 在 收集 了 第 j 个 大 学 的 n 个 案例 并 计算 
了 该 校 的 样本 均值 了 以后， 我 们 就 可 以 运用 方程 13.5 计算 后 验 估 计 。 注 意 ， 
我 们 还 能 对 许多 学 校 来 计算 的“ 可靠 性 ”"， 即 真实 均值 y 的 方差 与 样本 均 
值 了 的 方差 之 间 的 比值 ， 得 到 : 





Rel(Y) = A, = oo [13.7] 


RFRA p, 的 后 验 均值 和 方差 的 一 种 新 的 表达 方式 ， 即 ; 


有 =A¥,+(b-A)y [13.8] 


Vi = ho /n, 

X n 增 大 时 ， 样 本 均值 就 变 成 几 更 可 靠 的 估计 ， 并 且 后 验 均值 也 受到 样本 均 
值 更 强烈 的 影响 。 当 样本 均值 变 得 完全 可 靠 (A, =1) 时 ， 后 验 均值 和 方差 分 
别 为 矶 和 [m， 与 经 典 理论 达成 一 致 。 然 而 ， 在 达到 完全 可 靠 之 前 ， 贝 叶 斯 
后 验方 差 将 会 小 于 0° /n,, WH A, 不 能 超过 1.0。 

区 间 估 计 。( 从 现在 开始 ， 为 了 简洁 起 见 我 们 省 略 下 标 j。) 贝 叶 斯 方法 习 
惯 于 描述 未 知 参数 处 于 特定 区 间 的 后 验 概率 ， 这 个 概率 是 由 后 验 分 布 计算 得 
BM. ERE Y WRF, 


Problpy” ~ 1.96/V" <p <p’ +1.96 /V") = 0.95 [13.9] 


从 上 述 讨论 中 我 们 可 以 看 到 ， 贝 叶 斯 可 信 区 间 在 宽度 上 从 不 会 超过 经 典 的 
KE WREEF, Hu =Y, V) = /n， 贝 叶 斯 的 和 经 典 的 区 间 就 
会 完全 重合 。 但 是 ， 如 果 先 验 精 度 7 一 大 于 零 ， 则 贝 叶 斯 区 间 就 要 罕 些 。 
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假设 检验 ， 为 了 检验 零 假设 H, :p500 和 备 拌 假设 H.: >500， 贝 叶 斯 统 
计 方法 要 计算 : 


p = Prob(u < 500 | Y) [13. 10] 


即 作 落 入 由 零 假设 所 限定 的 区 域 中 的 概率 。 如 果 疡 充分 小 (P<a) ， 便 拒绝 这 
个 零 假 设 。 同 样 ， 如 果 先 验 精 度 r 为 零 ， 所 计算 的 p 值 就 与 经 典 统计 的 p 值 
完全 相同 ， 尽 管 其 p 值 解 释 为 “H, 为 真 的 概率 ”"， 不同 于 经 典 陈述 的 那样 : p 
是 “在 零 假设 条 件 下 ， 取 得 的 样本 平均 数 大 于 等 于 当前 样本 平均 数 的 概率 ”。 


有 关 推 广 和 推论 的 一 些 问 题 


在 上 面 的 例子 中 ， 如 果 (a) 先 验 精度 为 零 ， 或 者 (b) 样本 规模 无 限 扩 
大 ， 贝 叶 斯 统计 和 经 典 统计 的 结果 在 数值 上 完全 吻合 。 在 更 加 复杂 的 例子 中 ， 
这 种 收敛 一 般 也 能 成 立 。 与 此 类 似 ， 如 果 先 验 信息 不 为 零 量 样本 规模 又 不 太 大 
方法 得 出 的 结果 更 加 精确 - 

对 贝 叶 斯 观点 的 一 个 普遍 争议 是 : 科学 对 反映 某 一 研究 者 个 人 先 验 设想 的 
推论 不 以 为 然 。 因 此 ， 最 为 频繁 的 争论 是 针对 点 估计 、 区 间 估 计 以 及 假设 检 
验 ， 认 为 这 些 估 计 应 该 完全 根据 数据 的 情况 来 决定 。 贝 叶 斯 方法 对 此 的 反 驱 
是 ， 人 们 总 是 可 以 令 其 先 验 设想 的 精度 为 零 或 是 接近 于 八 ， 在 这 种 情况 下 ， 忠 
叶 斯 分 析 会 相当 地 接近 (在 很 多 情况 下 甚至 是 精确 地 等 于 ) 经 典 方法 所 得 到 
的 结果 。 这 只 不 过 是 明确 表示 了 一 个 事实 ， 即 没有 先 验 信息 可 得 或 是 先 验 信息 
没有 用 处 。 然 而 ， 即 使 在 这 种 场合 ， 贝 叶 斯 方法 也 偏好 于 对 基于 概率 积分 的 所 
有 未 知 参 数 做 概率 的 解释 。 没 有 必要 去 求助 于 智力 建构 的 “对 某 一 总 体重 复 
抽取 随机 样本 ”来 为 推论 的 合理 性 辩护 。 

贝 叶 斯 方法 ， 经 典 的 评估 。 采 用 贝 叶 斯 方法 和 解释 但 仍然 依赖 经 典 方 法 来 
评估 由 先 验 分 布 所 计算 的 点 估计 、 区 间 估 计 和 假设 检验 的 合理 性 ， 这 是 可 能 的 
(Gelman et al. ，1995 ,第 4 章 )。 例 如， 给 定 一 个 贝 叶 斯 点 估计 量 ， 也 可 以 
在 多 次 重复 抽样 中 评估 它 的 经 典 性 质 ( 如 有 效 性 efficieney ) 。 一 些 研究 已 经 表 
明 ， 当 运用 于 分 层 模型 时 ， 贝 叶 斯 估计 量 在 许多 样本 中 也 具有 好 的 性 质 ( Car- 
lin & Louis, 1996, 第 4 R) 

多 套数 的 情形 ， 在 我 们 简单 列举 的 例子 中 ， 只 有 一 个 参数 需要 估计 。 为 
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了 简单 起 见 ， 我 们 还 假定 ”已 知 ， 当 然 ， 这 是 不 实际 的 。 当 有 多 个 未 知 参 数 
时 ， 贝 叶 斯 方法 还 是 直截了当 的 : 定义 所 有 参数 的 先 验 概率 分 布 ， 收 集 数据 ， 
然后 根据 贝 叶 斯 定理 计算 “联合 后 验 概率 估计 ”。 例 如 : 


:yy Æ LHe p(u.o*) . A 
a | = * * 13. 11] 
pas |Y) RY) Í 








现在 、 假 定 我 们 的 日 的 是 对 做 推断 。 尽 管 对 o? NRK, EX a 进行 
推断 时 必须 要 考虑 o 信息 的 缺乏 。 我 们 对 于 的 推断 将 会 建立 在 “边缘 后 验 
分 布 ”上 ， 这 就 是 在 对 o 积分 以 后 的 后 验 分 布 : 


pa |Y) = fim do 


= feiu | a°, De mde [13.12] 
W “m 
= Epulon pa |N F pio |Y) 


为 了 理解 最 后 那个 表达 式 ， 假 定 我 们 选择 MAAF 0 和 某 一 非常 大 的 数 之 间 
的 o 的 可 能 值 。 对 每 个 of 值 ， 我 们 计算 出 的 后 验 密度 ,， 即 p(y | og?，Y)。 
然后 对 所 有 这 些 计算 加 权 平 均 数 ， 其 权 数 为 p( oz lY), Mo 的 后 验 概率 密 
度 。 这 个 思路 就 是 , py | o*，Y 的 后 验 分 布 可 以 就 a 的 每 一 个 可 能 值 来 进行 评 
估 。 这 样 一 个 “条 件 后 验 分 布 ” 是 边缘 后 验 分 布 的 一 个 很 好 的 表达 形式 ， 即 
P(41Y)， 只 有 对 我 们 正在 依据 的 o, 值 时 才 是 未 知 ez 的 一 个 似 真 值 。 在 为 几 
建构 边缘 后 验 的 过 程 中 ， 我 们 为 每 一 个 条 件 后 验 分 布 p(w | ol, Y) 按 那 一 o 
值 的 “ 似 真 值 ”( plausibility) 加 权 ， 其 中 似 真 值 为 p(ez |Y). 

这 个 例子 表明 ， 当 一 个 “辅助 参数 ”( 在 这 里 为 oa*) 未 知 时 ， 贝 叶 斯 
方法 提供 的 所 关注 的 “焦点 参数 ” (focal parameter, ÆR BH p) 的 推断 
中 , 已 经 考虑 到 了 辅助 参数 的 不 确定 性 。 存 本 例 中 ， 这 是 通过 对 辅助 参数 
所 有 的 可 能 值 取 平均 数 来 完成 的 。 正 如 我 们 将 看 到 的 那样 ， 在 对 焦点 参数 
进行 推断 的 过 程 中 ， 对 辅助 参数 的 不 确定 性 的 考虑 正 是 贝 叶 斯 方法 在 分 层 
模型 应 用 中 的 重要 优势 。 


贝 叶 斯 视角 下 的 分 层 线性 模型 


在 前 面 关 于 两 层 模型 的 章节 里 ， 对 于 正 态 分 布 的 结果 ， 我 们 曾 寻求 对 三 种 
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类 型 的 未 知 参数 进行 推断 ， 包 括 : 层 -1 随机 系数 B; 层 -2 固定 系数 Y; 以 及 
方差 协 方差 参数 ， 例 如 层 - 1 系数 的 方差 协 方差 矩阵 T 和 残 差 的 层 - 1 方差 
o ， 我 们 采用 了 两 种 通用 的 策略 来 获得 这 些 估计 。 首先 是 在 完全 最 大 似 然 估 计 
(ML) 的 基础 上 去 估计 y、o? MT, UE BHARI. KRETA 
束 最 大 似 然 估计 (REML) 的 基础 上 去 估计 下 和 oa， 以 及 yy 和 B 的 经 验 贝 叶 
斯 佑 计 。 我 们 简要 回顾 这 些 方法 的 运 辑 ， 并 思考 贝 叶 斯 方法 如 何 能 增加 推断 的 
Ay ht. JSF ML 和 REML 都 是 经 典 程序 ， 但 我 们 将 展示 REML 也 可 以 视 为 一 种 
由 完全 ML 转变 而 来 的 “ 偏 贝 叶 斯 方法 " 。 此 外 ， 在 分 层 模 型 的 情况 下 ， 甚 至 
ML 本 身 都 有 一 定 程 度 的 贝 叶 斯 味道 。 


对 y、T 和 gg 的 完全 最 大 似 然 估计 


完全 ML ARM RAY PAS EA y Tio Whit, WF 
给 定 样本 数据 Y 的 周 定 值 使 这 些 参 数 的 联合 似 然 值 最 大 化 ( 详 见 第 14 BE). 
fey, TH o 这些 ML 估 计量 给 定 的 条 件 下 ， 我 们 计算 出 层 -1 系数 B 的 经 验 
贝 叶 斯 估计 。 这 个 方法 拥有 几 个 关键 性 的 优点 。 

1. 在 极为 一 般 的 情况 下 ，?y、T 和 的 ML 估计 量具 有 一 致 性 ， 也 就 是 
说 ， 当 层 -2 的 样本 规模 了 增加 时 ， 它 们 收敛 于 参数 的 真 值 。 这 还 意味 着 它们 
是 渐进 无 偏 的 ， 即 当 了 增加 时 ， 任 何 偏差 都 将 越 来 越 小 。 

2. 此 外 ,这 些 估计 基 都 是 有 效 的 ， 意 思 是 说 ， 在 大 样本 中 ( 即 /很 大 
时 ) ， 不 存在 拥有 更 小 方差 的 其 他 无 偏 估计 。 

3. 对 一 个 很 大 的 / 而 言 ， 如 果 T 的 ML 估计 量 是 正定 的 〈 例 如 ， 这 要 求 
EAH RA AS, H ML 的 协 方差 估计 不 产生 等 于 +1.0 这 样 的 相关 )， 
那么 这 些 估计 量 的 抽样 分 布 近 似 于 正 态 。 这 些 大 样本 的 正 态 抽 样 分 布 拥有 已 知 
的 方差 和 协 方差 ， 其 至 对 非常 复杂 的 模型 也 是 这 样 。 这 就 意味 着 ， 对 -- 个 很 大 
的 J， 正 态 分 布 可 以 被 用 来 建构 置信 区 间 和 检验 显著 性 ， 并 且 非 常 方便 。 

4. 同样 ， 当 了 很 大 时 ,， 层 -1 系数 的 经 验 贝 叶 斯 (EB) 估计 也 将 会 有 一 
些 很 好 的 性 质 。 更 重要 的 是 ， 平 均 而 言 ， 它 们 将 比 其 他 方法 的 统计 量 更 为 准确 
( 即 它们 的 均 方 误 更 小 ， 参 见 Morris，1983; Raudenbush, 1988), 。 这 些 EB ffi 


DO 正如 第 14 章 申 所 显示 的 那样 ，ML 方法 与 经 验 贝 时 斯 估计 在 每 一 个 选 代 集合 中 都 是 被 同步 计算 
的 ,它们 是 严格 概念 化 的 
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计生 优势 的 来 源 之 一 是 它们 依赖 于 Y、T 和 的 ML 估计 量 。 这 些 ML 估计 极 
好 的 大 样本 性 质 加 强 了 对 B 的 推断 。 

读者 可 能 已 经 注意 到 以 上 这 些 大 有 神 益 的 性 质 都 依赖 于 “很 大 的 J”, B 
需要 拥有 大 量 的 层 -2 单位 数目 。 于 是 ， 自 然 会 产生 “小 规模 /7” 的 问题 : 如 
果 层 -2 单位 的 数量 较 少 ， 这 些 估 计量 仍然 值得 信赖 吗 ? 

对 这 个 问题 的 回答 关系 到 设计 的 其 他 方面 ， 特 别 是 设计 的 平衡 程度 ， 并 且 
还 关系 到 哪些 参数 是 研究 者 最 感 兴趣 的 。 主 要 关注 点 如 下 : 

1. 在 小 样本 规模 下 ，Y 和 T 的 统计 或 许 是 相当 不 准确 的 。 此 外 ， 这 两 个 
统计 量 ， 尤 其 是 T 中 的 方差 元 素 ， 将 不 会 服从 正 态 的 抽样 分 布 。 例 如 ， 假 定 
某 一 方差 元 素 fw 近似 于 正 态 分 布 ， 可 能 导致 统计 推断 的 严重 误差 。 我 们 将 用 
一 个 小 样本 数据 的 简单 的 应 用 例子 来 显示 这 种 情况 。 

2. 如 果 数 据 不 平衡 ，Y 的 估计 就 会 以 的 ML 估计 的 函数 来 作为 其 权 数 
( 见 第 3 章 的 几 个 简单 例子 和 第 14 章 中 的 一 般 情况 )。 这 些 权 数 的 随机 误差 将 
使 Y 产 生 不 确定 性 ， 然 而 这 种 不 确定 性 通常 在 使 用 ML 方法 软件 所 打印 出 来 的 
标准 误 中 得 不 到 反映 。 因 此 ，Y 的 置信 区 间 会 比 其 应 有 的 宽度 窄 一 些 ， 显 著 人 性 
检验 也 会 比 它 原先 应 该 的 那样 更 宽松 、 更 容易 通过 。 在 小 样本 / 时 ， 数 据 越 不 
平衡 ， 这 种 问题 就 可 能 越 严 重 ， 因 为 设计 越 不 平衡 时 权 数 之 间 的 差别 就 越 大 。 
这 种 情况 便 是 ， 一 个 辅助 参数 (这 里 指 T) 的 不 确定 会 导致 对 焦点 参数 y OH 
断 错误 。 而 贝 叶 斯 方法 可 以 解决 这 个 问题 。 

3. 类 似 地 ， 对 的 推断 也 没有 顾及 y 的 不 确定 性 。 在 一 些 应 用 里 ，T 本 
身 可 能 就 是 焦点 参数 ， 我 们 想 要 确保 对 它 的 推断 不 会 因为 其 他 辅助 参数 的 不 确 
定性 而 失真 。 

4. 因为 BB 的 EB 估计 也 得 依赖 于 对 y, o AT AY ML 估计 ， 所 以 这 些 ML 
估计 的 误差 也 会 使 B 产 生 额 外 的 不 确定 性 。 可 是 这 种 附加 的 不 确定 性 不 能 被 用 
EB 方法 计算 的 标准 误 所 反映 。 同 样 ，B 的 置信 区 间 会 过 窗 ， 对 B 的 检验 也 会 
过 松 。 这 个 问题 仅仅 是 当 了 很 小 时 出 现 的 ， 但 是 当 m ( 层 -2 单位 j 中 的 样本 
规模 ) 很 大 时 便 会 有 所 削减 ， 因 为 在 那 种 情况 下 ，B 的 EB 估计 将 主要 地 依赖 
于 那个 单位 的 数据 。 然 而 ， 对 很 小 的 / 和 很 小 至 中 等 的 n 而 言 ，EB 估计 量 对 
可 能 不 准 的 辅助 参数 (这 里 指 y, o AT) 估计 量 的 依赖 性 是 不 理想 的 。 

与 之 相 比 ，c 的 ML 推断 通常 对 很 小 的 / 或 数据 不 平衡 的 性 质 并 不 敏感 。 
这 是 因为 对 o’ 估计 的 准确 性 基本 上 依赖 于 所 有 层 - 1 单位 的 总 样本 规模 N, 
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即 N= 于 n,。 在 大 多 数 场 合 ，N 都 很 大 ， 足 以 支持 对 o’ 进行 坚实 的 推断 。 

ABA, ML - EB 方法 的 关键 问题 是 ， 关 于 焦点 参数 的 推断 依赖 于 其 他 未 知 
辅助 参数 的 点 估计 ， 并 且 这 些 推断 没有 充分 考虑 到 其 他 未 知 参数 的 不 确定 性 。 
当 J 很 小 而 且 层 -1 的 数据 非常 不 平衡 时 ， 这 个 问题 是 最 突出 的 。 但 是 ， 约 束 
最 大 似 然 估计 (REML) 方法 部 分 地 解决 了 这 个 问题 。 


对 下 和 ga” 的 REML 估计 


以 yn 来 表示 YY 的 任意 可 能 取 值 ， 我 们 定义 了 和 ez" HURA LT, o | yn, 
Y), MERINA L. (T, o |y., Y) 所 有 可 能 取 值 的 平均 值 ， 我 们 就 可 以 
得 到 在 单独 给 定 Y 以 后 下 和 oo 的 似 然 估计 值 。 这 称 为 有 限制 条 件 的 似 然 估 计 
L(T, o |Y) ， 因 为 它 并 不 包含 Yo 

在 REML 方法 中 ， 所 选择 的 T Ao 的 估计 值 的 原则 是 ， 对 给 定 样本 观测 
数据 Y， 能 够 使 这 些 参 数 的 联合 似 然 值 最 大 化 的 值 。 在 这 些 ML 估计 的 条 件 
下 ,我 们 再 计算 对 Y 的 一 般 化 最 小 二 乘 估计 和 层 -1 系数 B 的 经 验 贝 叶 斯 估 
计 。 这 个 方法 拥有 几 个 重要 的 优点 。 

正如 ML 估计 那样 ，T H o’ 的 REML 估计 是 一 致 和 有 效 的 ; 此 外 ， 在 ML 
的 方差 估计 不 为 零 且 ML 的 协 方差 分 量 估计 是 在 可 接受 的 范围 之 内 (Hm, T 
的 REML 估计 必须 是 正定 的 ) 时 ， 只 要 了 很 大 ， 这 些 统计 量 的 抽样 分 布 近似 于 
正 态 分 布 。 然 而 ， 与 ML 方法 不 同 的 是 ，T 的 REML 估计 还 考虑 了 y 的 不 确定 
性 。 我 们 可 以 将 了 的 REML 估计 视 为 的 所 有 可 能 的 ML 估计 的 加 权 平 均 数 ， 


D LAT, o |y V 的 平均 应 该 是 一 个 加 权 平 均 。 它 的 权 数 与 Ye 的 近似 估计 成 比例 。 假 定 Y 
是 一 个 标量 〈 译 广 ， 即 无 搬 纲 的 线 重 ) ， 我 们 选择 ym a1, M), ey, 远 远 小 于 零 而 Y。 
远 远大 于 替 ， 并 县 在 此 范围 中 连续 不 断 地 取 y, 的 值 。 当 这 个 “和 ”中 项 的 数量 无 限 增加 (E 
时 介 于 相 邻 的 两 个 y, 值 之 间 的 距离 无 限 地 缩小 ) 时 ， 这 个 加 权 平均 收 敏 于 积分 : 
üm $ ply, [¥) + La CT, o? | Yn. Y) =pl | YLT, o | y.¥) ay 
=1L(YT,o | Yay 
=L(T,o* |Y) 
fe REML 方 法 下 7 OT RR) Riah (GLS) 可 能 会 被 看 作 经 验 贝 叶 斯 估计 。 当 y 的 先 验 精 
AVES. CNB EM Yo y.B| TT,g? ,YY) 这 个 给 定 了 下 、a? 的 REML 估计 和 数据 的 yY、B 的 
RR (WERI A). HM. T. o, YZE., yh GLS AtA RH 
Ely] T, e, Y), 
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其 中 每 一 个 可 能 的 ML 估计 都 是 针对 一 个 可 能 的 Y 值 计算 出 来 的 。 由 于 通过 对 
这 些 可 能 的 估计 值 取 平 均 数 ， 而 不 是 以 一 个 Y 的 估计 作为 条 件 ， 所 以 了 T 的 
REML 估计 有 效 地 兼顾 了 未 知 y 的 不 确定 性 。 

le] ML 方法 一 样 ， 层 -1 系数 的 EB 估计 也 会 有 很 好 的 大 样本 性 质 。 这 些 
EB 估计 将 依赖 于 T 和 的 REML 估计 ， 而 且 这 些 ML 估计 极 好 的 大 样本 性 质 
还 加 强 了 对 B 的 推断 。 

REML -EB 方法 的 局 限 是 与 ML -EB 方法 的 局 限 密切 相关 的 。 同 样 ，T 的 
估计 在 小 样本 时 可 能 相当 不 准确 ， 此外， 在 大 多 数 的 应 用 中 ，T 的 方差 估计 不 
会 近似 于 正 态 样本 分 布 ， 除 非 其 样本 规模 异常 大 ， 并且 仍然 是 ， 如 果 数 据 不 平 
衡 ，Y 的 估计 就 会 受权 数 的 影响 ， 进 而 依赖 于 的 REML 估计 ， 以 至 于 了 估计 
中 的 随机 变异 会 导致 y 的 不 确定 性 ， 而 且 这 种 不 确定 性 在 常规 标准 误 的 计算 中 
得 不 到 反映 。 因 而 ，Y 的 贰 信 区 间 将 窗 于 它们 应 该 呈现 的 那样 ， 而 且 显 著 性 检 
验 也 会 比 原来 更 易 通过 。 在 此 ， 问 题 再 一 次 发 生 ， 当 了 很 小 时 ， 数 据 越 不 平 
街 ， 问 题 就 越 严重 。 

因为 B 的 EB 估计 还 依赖 于 下 和 oo 的 REML 估计 ， 这 些 REML 估计 里 的 
误差 也 会 在 这 些 EB 估计 中 产生 额外 的 变异 。 这 种 额外 的 不 确定 性 在 用 EB 方 
法 计算 的 标准 误 中 也 反映 不 出 来 。 同 样 ，B 的 置信 区 间 会 过 窗 ，B 的 检验 也 会 
过 松 。 然 而 与 ML 的 情况 不 同 的 是 ， 基 于 T 和 的 REML 估计 的 EB 点 估计 能 
够 准确 地 反映 关于 Y 的 不 确定 性 。 

总 之 , 在 ML -EB 方法 中 ， 关 键 参数 的 推断 依赖 于 其 他 未 知 辅助 参数 的 点 
估计 ， 并 且 这 些 推断 没有 充分 顾及 其 他 参数 的 不 确定 性 。REML 方法 通过 在 了 
和 8 的 估计 中 考虑 了 y 的 不 确定 性 而 部 分 地 解决 了 这 个 问题 。 在 这 个 意义 上 
说 ，REML 方法 可 以 被 作为 一 种 “ 偏 贝 叶 斯 方法 "， 我 们 将 在 后 面 的 例子 中 对 
此 加 以 说 明 。 

与 之 相 比 ， 一 个 “完全 贝 叶 斯 方法 ”应 该 确保 对 每 一 个 参数 的 推断 都 完 
全 顾及 所 有 其 他 参数 的 不 确定 性 。 所 付出 的 代价 就 是 ， 完 全 贝 叶 斯 方法 要 求 设 
痪 所 有 参数 的 先 验 分 布 。 这 些 “ 先 验 ” 反 映 研究 者 关于 这 些 参 数 的 先 验 理解 
或 认识 。 而 通常 的 情况 是 ， 研 究 者 对 y o 和 了 知之 基 少 ， 因 此 他 就 会 建构 
一 个 “模糊 不 清 的 先 验 ”， 以 不 至 于 对 所 得 的 推论 形成 太 大 的 影响 。 然 而 ， 在 
本 书 所 关注 的 应 用 背景 中 ， 不 太 可 能 构造 一 个 完全 无 信息 的 先 验 ; 也 就 是 说 ， 
任何 先 验 的 选择 都 会 对 推断 产生 一 些 影响 。 因 此 ， 在 先 验 可 能 对 后 验 有 比较 重 
要 的 影响 时 ， 就 必须 采取 一 些 步骤 来 评估 推 斯 对 先 验 选择 的 敏感 性 ， 尤 其 是 在 
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样本 规模 很 小 的 场合 〈 也 就 是 说 ， 特 别 是 在 两 层 模型 时 而 / 又 很 小 的 情况 下 ) 


(Seltzer, Wong, & Bryk, 1996). 


AE HLM 的 贝 叶 斯 推断 基础 


依照 贝 叶 斯 观点 ， 观 测 数据 是 由 某 些 未 知 量 定义 的 概率 分 布 产 生 的 ， 先 验 
分 布 必须 对 所 有 这 些 示 知 二 赋值 。 将 给 定数 据 和 先 验 分 布 联合 起 来 将 产生 在 这 
一 数据 下 的 所 有 未 知 量 的 联合 后 验 分 布 。 对 具体 未 知 量 (如 焦点 参数 ) 的 推 
断 可 以 通过 对 其 他 未 知 量 (如 辅助 参数 ) 所 有 可 能 值 取 平 均 数 得 到 。 我 们 现 
在 将 这 一 原理 应 用 于 两 层 数据 的 分 层 线性 模型 。 


观测 数据 的 模型 


观测 数据 的 贝 叶 斯 模型 与 在 本 书 其 他 地 方 使 用 的 标准 层 - 1 模型 完全 一 
致 。 对 于 层 -2 单位 / 中 的 层 -1 单位 i， 我 们 有 结果 YA: 


e-i 
¥, = By + VBXy try. n ~ NO) [13.13] 


依据 贝 叶 斯 理论 ， 观 测 数据 Y 是 依 /(Y | 8，o*) 来 分 布 的 ， 其 中 /是 正 态 密度 ， 
而 Y 是 一 个 以 每 一 层 -2 单位 j=1，…，J 中 的 所 有 层 -1 单位 i=1，…, nn 的 
结果 区 为 元 素 的 向 量 。 与 此 类 似 ，B 是 一 个 以 B。 为 元 素 的 向 量 。 结 果 YARE 
为 独立 的 正 态 分 布 ， 其 均值 为 : 


Q- 
ECY, | Bo?) = By + Y BX (13. 14] 


HEH c. RANDAL A AH B 和 oo? 的 先 验 分 布 ， 这 需要 设置 一 个 两 阶 
段 的 先 验 。 


第 一 阶段 的 先 验 


贝 叶 斯 先 验 概率 的 第 一 阶段 与 本 书 其 他 地 方 使 用 的 标准 层 -2 模型 是 完全 
相符 的 : 
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By = Ya + Err, + us [13.15] 
这 里 ，uwu，4 =0,，…，Q -1， 晓 成 了 一 个 具有 方差 为 Var( uv) = rw、 协 方差 
H Cov (uy, uy) =Tw 的 @ 维 多 元 正 态 分 布 。 按 贝 叶 斯 方法 ， 这 就 设置 了 第 
-阶段 的 先 验 分 布 为 p,(Bly，T)， 其 中 YY 是 一 个 以 y,, 为 元 素 的 向 量 ,，T 是 一 
个 以 Ty 为 元 素 的 矩阵 ， 这 就 是 通常 称 为 “可 互 换 的 ” 先 验 。 说 向 量 @ 的 元 素 
uj 是 可 互 换 的， 是 因为 没有 任何 先 验 信息 可 以 使 我 们 确信 ， 来 自 单位 j 的 向 量 
u 的 元 素 比 从 一 些 其 他 层 -2 单位 六 的 向 量 u' 的 元 素 要 大 或 是 小 。 在 贝 叶 斯 
统计 本 请 中 ， 可 互 换 性 的 含义 类 似 于 说 : 向量 u, j=1，…，J， 构 成 了 这 类 
向 量 的 总 体 中 的 一 个 简单 随机 样本 。 如 果 研 究 者 的 确 拥 有 关于 u 的 可 能 值 ， 
那么 这 些 信息 就 应 被 结合 到 模型 之 中 ， 比 如 通过 加 入 解释 变量 W, 来 解释 这 些 
差异 。 


第 二 阶段 的 先 验 


为 了 完成 贝 叶 斯 设置 ， 还 必须 设置 yY、o, 和 T 的 先 验 分 布 。 没 有 这 样 
的 先 验 分 布 ， 还 是 不 可 能 建构 这 些 参 数 的 后 验 分 布 ， 因 而 也 不 可 能 去 做 关 
于 它们 的 概率 性 陈述 (回顾 贝 叶 斯 方法 的 目的 ， 就 是 要 对 所 有 未 知 参 数 进 
行 合理 的 概率 陈述 )。 因 此 ， 我 们 还 得 设置 先 验 分 布 p,(y，o ”，T)。 从 现 
在 起 ， 我 们 先 将 这 一 未 设置 的 先 验 分 布 的 具体 形式 放 在 一 边 。 它 将 在 不 同 
的 研究 中 取得 具体 的 形式 ， 但 是 在 大 多 数 情况 下 ， 这 一 先 验 的 选择 反映 的 
是 “ 先 验 无 知 "”， 也 就 是 说 .研究 者 对 于 这 些 参 数 根本 没有 或 几乎 没什么 
先 验 信息 。 


后 验 分 布 


在 给 定数 据 后 ， 对 所 有 末 知 参数 的 统计 推断 根据 其 联合 后 验 分 布 推导 出 
来 。 在 这 种 情况 下 ， 


: Y| Boy iT oT 
p(B.y.@ .TIY) = AAI Dn Yet) [13.16] 


HY) 是 的 边缘 分 布 ， 它 是 一 个 正 态 化 的 常数 ， 确 保 其 后 验 有 笑 
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当 的 概率 分 布 。 
对 焦点 参数 的 推断 可 以 通过 对 辅助 参数 求 平均 数 得 到 。 例 如 ， 对 所 关注 的 


Y， 我 们 要 计算 : 


fiy|Y) = Beye ,TY opar’aT [13.17] 


完全 贝 叶 斯 推断 与 经 验 贝 叶 斯 推断 之 间 的 关系 


利用 Y、a 和 了 的 ML 估计 对 B 进 行经 验 贝 叶 斯 推断 。 先 很 定 Y、e3 AT 
为 已 知 。 研 究 者 对 第 二 阶段 先 验 的 p(y,o T) 的 先 验 信息 是 确定 的 ， 其 实 
是 一 种 极端 的 情况 : 在 这 种 情况 下 ， 未 知 的 只 有 B， 因 此 只 需要 再 有 第 一 阶段 
的 先 验 分 布 。 接 下 来 ， 对 B 进行 推断 的 基础 就 是 这 毕 给 定数 据 和 已 知 参 数 的 概 
率 分 布 ， 即 p(BiYy.o ,.T.Y)。 经 验 贝 叶 斯 推断 正 是 沿 着 这 条 路 走 的 ， 但 需要 
指出 的 是 ， 与 假定 Y、 了 和 已 知 的 做 法 不 同 ， 经 验 贝 叶 斯 方法 是 用 ML 估计 
hy. TMM y Tilo 的 真 值 。 为 了 对 B 进行 推断 ，Y、T 和 的 
真 值 被 假定 为 与 这 些 ML 估计 值 相 等 。 

利用 go 和 全 的 REML 估 计 对 B 和 进行 经 验 贝 叶 斯 推断 。 现 在 让 我 
们 假定 y 是 未 知 的 (和 8 一样 ), 但 下 和 wo 已 知 。 那 么 ， 贝 叶 斯 方法 将 为 
Y 设 置 一 个 先 验 分 布 ， 即 p,(Y|T,o )。 如 果 这 个 先 验 分 布 的 精度 为 0， 那 
么 关于 B 和 YY 的 推断 就 会 与 本 书 其 他 地 方 (第 3、5、7 和 14 章 ) 讨论 过 
的 经 验 贝 叶 斯 推断 几乎 一 样 ， 只 是 将 了 T 和 ?的 REML 估 计 代 入 了 后 验 分 
Hi p(BeylT.o’.Y). 于 是 ,T 和 :的 真 值 就 被 假定 为 与 REML 估计 值 相 
等 ,并且 对 yY 和 8 的 推断 将 建立 在 按 给 定 的 T 和 ez 的 REML 估计 值 的 后 
验 分 布 基础 之 上 。 

总 之 ， 本 书 中 其 他 地 方 描述 到 的 经 验 贝 叶 斯 过 程 可 以 看 成 在 某 些 辅助 参 
数 被 设 为 与 其 点 估计 相等 且 为 已 知 时 的 贝 叶 斯 过 程 。 在 应 用 ML - EB 方法 
H, KESHAB, MANE y, o 和 了 被 设 为 与 其 ML 估计 相等 。 在 应 
用 REML -EB 方法 时 .关注 参数 为 B 和 y， 而 辅助 参数 r 和 T 被 设 为 与 其 





DAT OE RUA. KARELA AO. MEERE ACY) = fine | B.07)p, (Bl y.T)p 
iy T.a’ apaya aT 是 个 正 态 化 的 常数 ， 以 确保 积分 为 1.0。 
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REML 估计 相等 。 正 如 早先 讨论 过 的 那样 ， 当 / 很 大 且 这 些 辅助 参数 的 ML 估 
计 或 REML 估计 相当 精确 时 ， 这 种 程序 的 工作 是 很 好 的 。 但 是 ， 总 的 来 说 ， 当 
4J 很 小 由 数据 又 不 平衡 时 ， 应 用 完全 贝 叶 斯 程序 就 会 引起 很 大 争议 。 我 们 将 借 
用 以 下 的 一 系列 例子 来 说 明 这 些 原 理 。 


例子 : 贝 叶 斯 与 经 验 贝 叶 斯 的 元 分 析 


为 举例 说 明 贝 叶 斯 方法 ， 并 将 其 与 大 家 已 熟悉 的 本 书 中 基于 ML 或 REML 
估计 所 进行 的 经 验 贝 叶 斯 推断 的 结果 相 比 较 ， 我 们 采用 的 简单 例子 为 那 19 项 
用 以 评估 教师 的 期 待 对 学 生 IQ 影响 的 实验 数据 。 这 个 例子 在 第 7 章 中 已 经 被 
描述 过 ， 其 数据 见 表 7. 1。 每 一 个 研究 都 产生 了 一 个 效应 规模 的 估计 d,， 以 及 
一 个 标准 说 的 平方 只。 这 一 研究 有 三 个 目的 ; (1) 对 19 项 研究 的 平均 效应 规 
模 进 行 估计 ; (2) 评估 效应 规模 的 变异 性 r; (3) 利用 所 有 这 19 项 研究 中 得 到 
的 信息 来 确定 对 每 一 项 个 别 研究 的 改进 的 效应 规模 估计 5 。 


贝 叶 斯 模型 


观察 数据 。 对 第 一 层 观察 的 结果 变量 的 贝 叶 斯 线性 模型 与 标准 的 层 - 1 模 
型 一 致 A: 


d, = 6 +e, e, ~ N(C,V) (13. 18] 


依照 贝 叶 斯 方法 ， 所 观察 的 数据 d HRA A fd 15，P) ， 此 处 ，/ 为 正 态 分 
布 。d 是 一 个 向 量 ， 其 元 素 为 来 自 单 位 j= 1，…，/ 的 必 。 类 似 地 ，5 是 一 个 
元 素 为 8 的 向 量 , V 是 一 个 对 角 和 矩阵 ， 其 对 角 线 上 的 元 素 为 V。 假 定 d; 这 个 
结果 是 独立 服从 正 态 分 布 的 ， 并 且 这 一 分 布 的 均值 为 E(d |5,) =6,， 其 方 
差 VW 已 知 。 我 们 还 必须 为 那些 未 知 参数 5 设置 先 验 分 布 ， 这 将 是 一 个 两 阶段 
的 先 验 分 布 。 

第 一 阶段 的 先 验 分 布 。 第 一 阶段 的 贝 叶 斯 先 验 分 布 与 第 7 章 中 使 用 的 标准 
fe -2 模型 相同 ， 为 : 


ô= y+u, u; ~ N(0,7) [13.19] 


其 中 , Gel, or, J) 独立 地 服从 以 0 为 均值 、 以 7 为 方差 的 正 态 分 布 。 按 


De 


UTI wee tr :Ti 


CONNIE mw ee ETH 
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贝 时 斯 方法 的 解释 ， 这 设置 了 第 一 阶段 的 先 验 分 布 为 p,(61y，7)。 

第 二 阶段 的 先 验 分 布 ”为 了 完成 这 一 贝 叶 斯 设置 ， 还 必须 对 y 和 7 的 先 验 
分 布 进 行 设置 。 对 这 些 参 数 ， 我们 将 假定 它们 的 先 验 分 布 为 独立 地 按 其 参数 范 
用 ( -wm <y<%; 0<r) 均匀 分 布 。 如 此 “扁平 ”的 先 验 分 布 表达 了 我 们 基 
本 上 没有 掌握 这 些 参 数 的 先 验 信息 。 对 y 和 7 这 两 个 参数 中 的 每 一 个 而 言 ， 所 
有 可 能 值 同样 适用 -这 种 先 验 分 布 的 一 个 优点 就 是 : 后 验 概率 将 与 似 然 估计 上 
(diy, 7) 成 比例 ， 这 就 便于 与 基于 最 大 似 然 估 计 之 上 的 推断 作 比 较 。 从 技术 
上 ， 我 们 可 以 写 为 : 


Pty.7) & CC, -œ <cycau Or £13. 20] 
其 中 C, 和 C, 为 任意 常数 小 数 。 
后 验 分 布 。 在 给 定 了 数据 后 ， 按 贝 叶 斯 定理 ， 对 所 有 未 知 参数 的 推断 可 以 
由 它们 的 联合 后 验 分 布 推导 出 来 。 在 这 种 情况 下 : 


fld | 8)p,(8 | y.r)psly,7) 
7 h(ad) 


< (Tn) (13.21) 


x (ef - i (d, - 6)°/V, - ue (6, - rv) 
2 f feal 


p(8,y.7 |d) 


其 中 h(d) 是 d 的 边缘 分 布 ， 它 是 一 个 正 态 化 的 常数 ， 确 保 该 后 验 概率 服从 一 
个 适当 的 概率 分 布 .> 

所 关注 的 焦点 参数 的 推断 是 建立 在 对 所 有 辅助 参数 求 平均 数 的 基础 上 。 让 
我 们 先 假定 y 和 7 共同 成 为 关注 焦点 ， 这 时 ，6,, j = 1，…，19， 便 为 辅助 参 
数 。 因 此 ， 我 们 的 兴趣 就 集中 于 : 


ely.t|d) = [fasy,7 |d) [13.22] 


进行 标准 的 计算 后 ， 我 们 便 能 看 到 ， 对 于 我 们 的 数据 ， 这 个 表达 式 变 为 ; 


T 这 个 先 验 分 布 的 密度 是 作为 一 个 “不 恰当 的 先 验 ”而 为 人 所 知 的 ， 因 为 作为 真实 的 概率 分 布 的 
期 遍 ， 其 积分 不 为 1. 0。 
2d MR AMER ACA), hihid) = fd | 8)p C | y.r)ps(y,r)drdydr 是 一 个 确保 积分 为 1.0 


的 正 态 化 常数 ， 
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" la 
sirada [Ten] exp[ - 0] [13.23] 
pel 





其 中 : 


Q= YW, +2) -y 


参数 估计 与 推断 


对 于 y 和 T 的 联合 分 布 及 边线 后 验 分 布 。 图 13. 1 展示 了 在 给 定 了 教师 预 
期 数据 d 之 后 的 均值 y 和 方差 7 的 联合 后 验 密 度 。y 的 后 验 分 布 是 单 峰 的 ， 近 
似 于 对 称 ， 绝 大 部 分 后 验 密度 都 介 于 - 0. 10 ~ 0. 20 之 间 ， 并 有 在 0. 10 附近 集 
中 的 趋势 。 与 此 相 比 ,7 的 后 验 密度 也 是 单 峰 的 ， 但 具有 相当 的 正 偏 态 ， 而 且 
绝 大 部 分 后 验 密度 介 于 0 至 大 约 0.08 之 间 ， 其 众 数 为 7 =0.013。 这 一 清晰 的 

图 示 表 达 了 两 个 边缘 后 验 密 度 之 间 的 关系 ， 即 : 
ply|d) = for. | d)ar 
(13. 24] 

pirid) = foc | d)ay 





图 13.1 在 给 定 d 的 条 件 下 y 和 7 的 联合 后 验 密度 


其 图 形 分 别 由 图 13. 2 和 图 13. 3 展示 。 
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图 13.2 ply|d) 的 分 布 


0.08 
0.06 
0.04 
0.02 


0.00 


图 13.3 p(r|d) 的 分 布 


ty 的 推断 。 因 为 y 的 后 验 密度 近似 于 对 称 (图 13.2) ， 所 以 y 的 中 心 趋 
势 可 以 用 其 后 验 均值 ELy | d) =0. 096 或 众 数 0. 078 来 近似 地 表示 。 大 多 数 合 
理 的 y 可 能 值 都 是 止 的 ， 但 负 的 小 数 也 不 完全 是 不 可 能 的 。 我 们 通过 计算 一 个 
近似 的 95% 后 验 可 信 区 间 来 使 我 们 的 视觉 领悟 形式 化 : 
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Prob[ (0.096 - 1,96 x 0.0656 < y < 0.096 + 1.96 x 0.0656) | d] tiss 
= Prob( - 0.033 < y < 0.225) = 0.95 j 


是 然 ， 我 们 不 能 拒绝 与 备 撞 假 设 H,:y > 0 MV MSR Hys BIH 
上 ， 我 们 还 可 以 计算 : 


Probty 三 0 | d) -f ply | d}ay = 0.063 [13.26] 


这 意味 着 ,尽管 y 取 负 值 比 y 取 正 值 的 概率 要 小 ， 但 不 能 排除 这 种 可 能 。 我 们 
还 注意 到 ，y 的 不 确定 性 很 大 ， 因 此 不 能 排除 平均 效应 规模 为 负 的 情况 ， 同 时 
其 值 也 可 能 达到 0. 23。 

对 7 的 推断 。 由 于 7 的 后 验 密度 呈正 偏 态 (图 13.3)， 因 而 7 的 中 心 趋势 
可 由 其 后 验 均值 E(r |d) =0.047 或 由 其 众 数 0.019 表示 出 来 。7 最 可 能 的 取 
值 都 分 布 在 后 验 众 数 附近 ， 因 此 为 正 值 。 然 而 ， 观 察 图 13.3 可 以 看 到 ，r 还 
是 有 可 能 取 零 值 的 。 

对 8 的 推断 。 假 定 我 们 现在 主要 关注 一 个 特定 实验 的 效应 规模 ， 比 如 5,， 
那么 ， 所 有 其 他 的 参数 都 是 辅助 参数 。 因 此 ， 我 们 对 它们 全 体 求 平均 数 ， 并 对 
相应 的 y 和 7 也 求 平均 ， 从 而 得 到 实验 4 的 后 验 分 布 : 


plô, |d) = SLf poral [13.27] 


x (38, 38, 08, dB, +389) dyar 


实验 4 的 边缘 后 验 密度 如 图 13.4 所 示 。 它 是 单 峰 的 ， 并 且 关 于 其 期 望 值 
E (ô, |d) =0.336 大 致 对 称 。 其 95% MRM KKH { -0.022，0.694) 。 

类 似 地 ， 图 13.5 展示 了 实验 17 的 后 验 密度 。 注意 ， 这 个 后 验 密 度 比 实验 
4 (图 13.4) 的 分 散 程 度 要 小 得 多 ， 因 为 实验 17 的 样本 要 大 得 多 ， 因 而 其 标 
准 误 就 小 得 多 : V, =0.139， 而 V,, =0.019, # 13.1 (b 列 ) 提供 了 每 个 5， 
J =1，…，19 的 后 验 均值 E(5 id) 和 标准 差 S(6, | d) 。 注 意 对 比 最 小 二 乘 估 
Fd (a WW) ECS |d) 的 相对 收缩 程度 。 还 要 注意 ， 后 验 标准 误 大 大 地 小 于 
最 小 二 乘 估计 的 标准 误 。 这 些 差 异 反映 出 : 贝 叶 斯 推断 在 给 定 所 有 其 他 效应 规 
模 的 条 件 下 考虑 到 了 每 一 个 5 的 先 验 信息 。 

概要 。 利 用 贝 叶 斯 方法 ， 在 给 定 了 未 知 参数 的 前 提 下 ， 我 们 首先 为 数据 设 
TR (方程 13. 18) ， 然 后 ， 我 们 又 为 未 知 参 数 设 置 了 两 个 阶段 的 先 
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图 13.4 p(6, |d) 的 分 布 
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图 13.5 p(s, |d) 的 分 布 
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分 县 线性 模型 ; 应 用 与 数据 分 析 方 法 


完全 贝 叶 斯 方法 、 基 于 ML 的 经 验 贝 叶 斯 方法 和 基于 REML 的 经 验 贝 叶 斯 
方法 对 效应 规模 5, 估计 的 后 验 均值 和 标准 差 与 其 最 小 二 坪 估 计 的 比较 












a) 最 小 二 乘 估计 
d 


($4) 


0.03 
(0. 125) 
0.12 
(0. 147) 
-0.14 
(0. 167) 
1.18 
(0. 373) 
0.26 
(0. 369) 
-0.06 
(0. 103) 
-0.02 
(0. 103) 
-0.32 
(0. 220) 
0.27 
(0. 164) 
0. 80 
(0.251) 
0. 54 
《0. 302) 
0.18 
(0. 223) 
-0.02 
(0. 289) 
0.23 
(0. 290) 
-0.18 
(0. 159) 
-0.06 
(0. 167) 
0.30 
(0. 139) 
0. 07 
(0.094) 
-0.07 
(0. 








(b) 完全 其 时 斯 估计 
ECS | d) 


Escala) | 


-0.060 
{0. 121) 
-0.010 
(0. 125) 
0.216 
(0. 110) 
0.074 
(0. 082) 
0. 007 
(0. 128) 











te) EB -ME fit |(d) 





(0. 101) 
-0.007 
(0. 106) 
0.216 
(0.129) 
0. 105 
(0.129) 
= 0.009 
(0. 083) 
0.017 
(0. 083) 
~0. 030 
(0.117) 
0. 161 
(0. 106) 
0. 250 
(0. 121) 
0. 163 
(0. 125) 
0. 110 
(0. 117) 
0. 065 
(0. 124) 
0.10 
(0. 125) 
= 0.029 
(0. 104) 
0.026 
(0. 106) 
0.19) 
(0.098) 
0. 074 
(0.078) 
0.025 
(0. 108) 



















EB - REMI. 估计 
E(8{d, $) 


Sta |a, 7) 





0. 054 
(0.096) 
0. 100 
《0. 104) 
-0. 006 
(0. 111) 
0.214 
(0. 137) 
0, 105 
(0. 137) 
~ 0. 008 
(0, 085) 
0.017 
(0. 085) 
~ 0.029 
(0. 123) 
0. 160 
. 110) 
0, 249 
. 127) 
0. 162 
. 133) 
0.110 
. 123) 


. 131) 
0. 110 
. 132) 
. 023 
108) 
0. 026 
. 110) 
0. 190 
(0. 101) 
0. 074 
(0. 080) 
0. 025 
(0.113) 
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验 分 布 (方程 13.19 和 13.20) 。 为 了 推断 有 关 焦 点 参数 ， 我 们 又 将 相应 的 辅 
助 参 数 结合 到 y、r 和 8 ，5, ，…，61s 的 联合 后 验 分布 中 去 。 对 任 一 焦点 参数 ， 
我 们 能 够 计算 该 参数 落 在 一 个 给 定 区 间 的 概率 ， 并 且 在 充分 考虑 其 余 辅 助 参数 
的 不 确定 性 的 前 担 下 ， 可 对 任 一 焦点 参数 进行 推断 。 我 们 发 现 ， 在 所 有 其 他 的 
后 验 分 布 近 似 于 对 称 的 情况 下 ， 方 差 r 的 后 验 密度 呈 很 强 的 正 偏 态 。 这 一 事实 
与 我 们 对 完全 贝 叶 斯 的 结果 与 经 验 贝 叶 斯 的 结果 (或 是 基于 EB - ML， 或 是 基 
于 FB - REML) 进行 的 比较 是 一 致 的 。 


完全 贝 叶 斯 推断 与 经 验 贝 叶 斯 推断 的 比较 


这 里 ， 我 们 要 考虑 的 是 应 用 ML 或 REML 估计 结合 经 验 贝 叶 斯 方法 对 三 类 
未 知 参 数 进行 推断 ， 即 层 - 1 的 系数 5 、 层 -2 的 系数 y， 以 及 层 -2 的 方差 7。 
我 们 特别 感 兴趣 的 是 将 这 些 结果 与 刚刚 获得 的 贝 叶 斯 结果 进行 比较 。 

基于 ML 对 y 和 7 的 推断 和 基于 EB 对 8 的 推断 。y 和 7 的 似 然 值 由 下 式 给 出 : 


Lid | ¥,7) = falaa | 7.7). 06 [13.28] 


我 们 上 述 的 贝 叶 斯 分 析 是 建立 在 y M r 的 均匀 先 验 分 布 上 的 (见方 程 13.20 及 
随后 的 讨论 ) ， 这 一 似 然 值 与 联合 后 验 分 布 成 比例 (方程 13.23) ， 如 图 13.1 
所 示 。 在 ML 估计 中 , Hey 和 的 联合 众 数值 作为 其 点 估计 (注意 图 13. 1 中 
的 联合 众 数 ) 。 

(1) ty 的 推断 。 根 据 ML 理论 ， 在 给 定 y 的 真 值 后 ，ML 估计 ?7 的 大 样 
本 分 布 服 从 以 y 为 均值 的 正 态 分 布 ， 其 标准 误 可 以 由 Fisher 信息 矩阵 (RE 
14 章 ) 计算 出 来 。 我 们 得 到 的 结果 为 ， 7 =0. 078 ， 标 准 误 5; =0.048， 将 y 视 
为 与 了 相等 ， 这 将 使 我 们 能 够 计算 出 y 的 一 个 所 谓 的 “估计 抽样 分 布 ”( 见 图 
13.6) 。 这 与 给 定 ?7=0.013 时 的 y 的 后 验 分 布 [ 即 P(y lr =F =0.013)] 相 
等 。 根 据 ML 的 逻辑 ， 这 是 一 种 表达 y 可 能 值 的 方式 。 

我 们 现在 将 这 个 分 布 重 琶 到 先前 计算 的 边缘 后 验 分 布 pP(y |d) 上 (图 
13.6)。 在 y 的 ML 估计 及 其 估计 标准 误 的 条 件 为 * = 7 时， 其 后 验 分 布 便 是 
对 所 有 可 能 的 y 值 所 取 的 平均 数 (方程 13.24) 。 这 两 种 y 的 可 能 取 值 分布 重 
合 程度 很 大 。 但 是 ， 边 缘 后 验 分 布 比 给 定 fi 条 件 时 分 布 的 离散 程度 更 大 一 些 ， 
这 不 足 为 奇 ， 因 为 边缘 后 验 分 布 考虑 到 了 r 的 不 确定 性 ， 而 依 y | fu 条 件 的 后 
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验 分 布 却 没 有 考虑 。 
0.08 = | 
| fy — pyle 
ro hs ply | dr=ra) 
0.06 i ‘ 
要 0.04 
* 
0.02 
0.00 — ak * ——— * 








图 13.6 ply|d) 和 p(y|d, 7=7Tw) 相对 于 y 的 标 绘图 


(2) 对 7 的 推断 。 依 照 ML 理论 ， 在 给 出 了 7 值 之 后 ,大 样本 估计 量 + 服 
从 以 7 为 均值 的 正 态 分 布 ， 其 标准 误 可 由 Fisher 信息 矩阵 计算 出 来 。 我 们 所 得 
的 结果 为 ， 7 =0.013， 标 准 误 S; =0.012， 设 7 与 7 相等, 便 使 我 们 能 够 将 这 
个 正 态 分 布 近似 地 描述 为 了 的 “估计 抽样 分 布 ”( 图 13.7)。 这 可 以 被 视 为 对 
真实 的 边缘 后 验 分 布 p(7 | d) 的 一 阶 近似 。 我 们 将 这 个 近似 分 布 与 以 前 计算 
的 分 布 P(7 | d) 的 真实 边缘 后 验 分 布 重 登 起 来 看 〈 图 13.3) 。 很 清楚 ， 这 个 近 
似 很 差 。 它 是 单 峰 的 ， 并 接近 于 对 称 ， 但 真实 的 后 验 分 布 却 呈 现 很 强 的 正 偏 
态 。 这 个 近似 中 包含 了 许多 负 值 ， 而 它们 是 不 可 允许 的 ， 并 且 还 排除 了 许多 按 
边缘 后 验 分 布 应 该 是 明显 合理 的 正 值 . 开 

利用 y 和 7 的 ML 估计 进行 8 的 经 验 贝 叶 斯 推断 。 用 ML - EB 方法 进行 8 
的 推断 ， 是 将 y 和 7 视 为 已 知 ， 并 且 等 于 其 ML 估计 。 在 这 样 的 假定 下 ， 对 5 


D 信用 7 的 均匀 先 验 分 布 的 一 个 好 外 是， 这样 便 使 7 的 边缘 后 验 分 布 与 似 然 值 成 比例 。 这 就 提供 
了 一 种 对 正 态 近 似 进行 检查 的 方法 。 然 而 ，Seltzer ( 据 作者 与 其 个 人 的 交流 ， 另 见 Seltzer 待 发 
表 的 著作 ) 也 讨论 了 它 的 一 些 不 足 之 处 。 他 在 模 报 中 发 现 . y 的 95 旬 后 验 区 间 要 比重 复 抽样 
HHA OSS KMK. 此 外 ， 它 似乎 也 不 像 是 一 个 能 确保 基于 频率 学 派 观 点 的 95% 区 间 的 先 验 分 
布 。 
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图 13.7 plr|d) 与 其 正 态 近似 之 间 的 比较 


的 推断 基于 条 件 正 态 分 布 ， 即 : 


6, | y.7.d, ~ 独立 的 NCS" V; ) [13. 29] 


其 中 : 


6 =Ad+(l-A)y [13.30] 


V =7(1-a,) 


4 


其 中 =7/(7 +v,)。 在 给 是 了 y、 7 和 4d 的 条 件 下 ,5, 的 后 验 均值 是 两 个 分 量 
的 加 权 平 均 数 : 一 个 分 量 是 对 处 理 效 应 估计 d,， 它 只 使 用 了 取 自 第 j 项 研究 的 
数据 ; 另 一 个 分 量 是 均值 y， 假 定 为 已 知 ， 但 实际 上 是 用 所 有 19 项 研究 提供 
的 数据 并 经 ML 估计 所 得 。 后 验方 差 +(1 -和 A,) 不 依赖 于 研究 项 目的 总 数 /， 
甚至 y 估计 的 准确 性 也 不 依赖 于 这 些 研究 项 目的 总 数 。 因 此 ， 后 验方 差 并 没有 
考虑 到 与 y 的 估计 相 联 系 的 不 确定 性 。 相 应 的 权 数 A, 也 假定 为 已 知 ， 尽 管 它 
们 其 实 都 依赖 于 7。 这 里 的 7 也 假定 为 已 知 ， 然 而 实际 上 必须 由 数据 估计 
HK, 

表 13.1 的 e 列 显示 了 基于 EB - ML 方法 (其 中 了 和 乡 均 是 ML 估计 量 ) 
估计 的 处 理 效应 的 均值 E(5, |d, 7, 7) 和 标准 差 S(5 | 4，?#，7) 。 首 先 我 们 
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注意 到 ，EB - ML 的 后 验 标准 差 比 完 全 贝 叶 荐 方法 的 后 验 标 准 差 (b BY) 小 得 
多 。 这 种 差异 产生 的 原因 是 ， 与 完全 贝 叶 斯 方法 不 同 ，EB - ML 方法 并 没有 顾 
及 T 和 的 不 确定 性 。 正 因为 如 此 ， 完 全 贝 叶 斯 的 标准 差 就 肯定 比 EB - ML 方 
法 产生 的 标准 差 更 加 准确 。 后 者 实际 上 存在 着 负 偏差 。 

其 次 ，EB - ML 的 后 验 均 值 比 贝 叶 斯 后 验 均 值 经 历 的 收缩 要 大 得 多 ( 注 
意 ， 完 全 贝 叶 斯 的 后 验 均 值 的 离散 程度 更 大 ) EB - ML 的 后 验 均值 是 在 假定 
7 =0.013 的 基础 上 计算 所 得 。 这 是 r 的 众 数值 (依据 图 13. 1) ， 但 是 在 r 的 后 
验 分 布 呈 正 偏 态 特征 的 条 件 下 (图 13.1 和 13.3)， 很 清楚 ， 取 较 大 7 值 的 可 
能 性 不 能 排除 。 完 全 贝 叶 斯 方法 通过 取 所 有 r 可 能 值 的 平均 数 来 计算 8 的 后 验 
均值 。Rubin (1981) 的 著作 对 此 做 了 清晰 的 说 明和 讨论 。 这 个 事实 使 我 们 倾 
向 于 认为 完全 贝 叶 斯 的 后 验 均值 比 基 于 EB - ML 计算 的 后 验 均值 更 为 可 靠 。 

对 7 的 REML 进行 推 断 。 将 在 y 和 7 值 条 件 下 的 似 然 值 对 y 积分 可 以 得 到 
7 的 有 约束 条 件 的 似 然 值 : 


L(d| 7) = [lca | y.r) ay = Mal (8 | y.7) aba [13.31] 


因为 上 述 贝 叶 斯 分 析 是 建立 在 y 和 7 有 均匀 先 验 分 布 之 上 的 (见方 程 13,20 及 
相应 的 讨论 )， 这 一 似 然 值 与 7 的 边缘 后 验 分 布 成 比例 (方程 13.24) ， 见 图 
13.3 所 示 。REML 估计 是 将 7 的 众 数值 0.019 作为 其 点 估计 (注意 图 13.3 中 
的 众 数位 置 ) 。 

依照 REML 理论 ，REML 估计 7wemi 的 大 样本 分 布 服 从 以 7 为 均值 的 正 态 分 
布 ， 其 标准 误 可 以 从 Fisher 信息 矩阵 中 计算 出 来 。 我 们 得 到 的 估计 结果 是 
Trem, =0. 019， 标 准 误 S; =0.015。 在 ML 方法 的 情况 下 ， 出 于 同样 的 原因 而 使 
得 近似 程度 很 差 。 

用 了 的 REML 估计 进行 y》 和 5 的 经 验 贝 叶 斯 推断 。 用 EB - REML 方法 来 
做 y 和 6, 的 推断 时 ,将 7 视 为 已 知 并 且 等 于 其 REME 估计 。 在 这 种 假定 下 ， 对 
7 和 65,jJ=1，…，J/ 的 推断 根据 其 联合 的 条 件 正 态 分 布 : 


(17) A A F) [13.32] 


其 中 ，V” 和 Vs 为 后 验方 差 . 0; ,是 后 验 协 方差 。 
关于 ? 的 推断 是 在 给 定 r 和 dd 条件 下 基于 其 边缘 后 验 分 布 得 到 ， 即 : 
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EY lr ty) yd, 
， 
— — 
Litt) [13.33] 
Vesey — 
E (ren) 
it f 


估计 y 是 J 个 研究 得 到 的 、 处 理 效应 估计 的 、 以 精度 加 权 的 平均 数 ， 它 的 
精度 为 那些 相应 精度 的 合计 (7 +n) “。 这 种 对 7y "的 表达 与 对 y 的 ML 估计 有 
着 同样 的 形式 ， 但 是 它 所 用 的 是 REML 估计 Tye = 0.019, MPE ry, =0.013。 
对 我 们 的 数据 进行 计算 ， 得 到 y ”=0.084 ， 其 标准 误 5,. =0.052， 相 应 的 95% 置 
信和 区间 为 ( -0.018，0.185) 。 这 一 区 间 比 EB - ML 估计 值 的 区 间 稍 大 一 点 ， 因 
为 一 般 情况 下 Trew 比 fw 稍 大 一 点 。 这 种 情况 的 发 生 是 因为 Taa DET 的 不 
确定 性 。 

对 5 的 推断 在 给 定 fatw Ald ( 即 方程 13. 32 AFA) 时 的 条 件 分 布 ， 
对 于 每 个 8， 我 们 有 : 


6° =Ad+(l-A)7 [13.34] 


AEE CETVEL TET HA 

这 里 虽然 使 用 了 tee i RE Ty, (A, 的 形式 与 在 ML 中 的 情形 依然 相同 ( 方 
程 13. 30)。 在 给 定 了 7 和 d 之 后 ，5 的 后 验 均值 如 同 在 ML 情况 下 一 样 是 一 个 
加 权 平均 数 ， 只 是 现在 的 公式 用 估计 y “来 代替 真 值 。 类 似 地 ， 后 验方 差 也 附 
加 了 一 项 O-A, ERAT VY 中 关于 的 不 确定 性 《比较 方程 13. 30 
和 13.34)。 因 此 ， 对 基于 REML -EB 的 ô, 的 推断 应 该 比 基 于 ML - EB 的 6 的 
推断 更 加 接近 实际 一 些 , 特 别 是 当 I 很 小 并 且 y 的 不 确定 性 相当 可 观 的 时 候 。 

表 13.1 (d 列 ) 展示 了 基于 EB - REML 方法 估计 的 处 理 效应 的 均值 和 标 
准 误 。 注 意 ，EB - REML 的 后 验 均值 比 EB - ML 的 后 验 均值 所 经 历 的 收缩 量 稍 
微小 些 。 这 是 因为 EB - REML 的 后 验 均值 是 建立 在 假定 之 上 的 7 =0.019， 这 
个 值 大 于 EB -ML 估计 的 0.013。 在 认为 5 是 不 同 质 时 ， 共 同 均值 将 会 产生 较 
少 的 收缩 。 正 如 所 期 望 的 那样 ， 这 些 标准 误 的 确 会 比 EB - ML 方法 产生 的 略 大 
一 些 (比较 表 13.1 中 的 。 列 和 d 列 )。 然 而 ,无 论 是 EB - ML 还 是 EB - REML 


D 译注: 原 书 该 公式 中 没有 所 说 项 目 ， 月 C，， 也 未 化 说 明 。 
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的 标准 误 都 没有 像 完全 贝 叶 斯 标准 谋 那 样 考虑 7 的 不 确定 性 。 注 意 ,5, 的 完全 
贝 叶 斯 标准 误会 比 REML 或 ML 方法 的 标准 误 更 大 。 

模型 检查 与 敏感 性 分 析 ， 教 师 期 望 数据 的 结果 的 有 效 性 取决 于 关键 假设 的 
有 效 性 。 首 先 ， 我 们 假定 ， 存 给 定 效应 规模 真 值 5, 以 后 ， 效 应 规模 的 估计 值 d 
服从 均值 为 8、 方差 为 V 的 正 态 分 布 。 在 用 中 等 至 很 大 规模 样本 来 研究 教师 
期 望 时 ， 根 据 中心 极 限定 理 ， 这 个 假定 应 该 是 合理 的 。 其 次 ,我 们 假定 ， 真 实 
的 效应 规模 本 身 在 各 个 研究 中 是 服从 正 态 分 布 的 。 这 个 假定 可 以 用 第 4 章 和 第 
9 章 所 描述 的 图 形 方法 来 检验 。Seltzer (1993) 曾 提 供 了 一 种 根据 一 族 1 分布 
对 真实 效应 规模 所 进行 的 敏感 性 分 析 。 再 次 ， 我 们 对 方差 7 设置 了 一 个 均匀 的 
先 验 分 布 。 进 一 步 的 敏感 性 分 析 应 该 通过 将 我 们 的 结果 与 其 他 未 提供 信息 类 型 
的 先 验 结果 相 比 较 ， 分 析 的 具体 性 质 将 取决 于 所 关注 的 焦点 参数 。 请 参见 
Gelman 等 人 (1995， 第 2 Be) 关于 运用 后 验 预测 分 布 进行 敏 感性 分 析 和 模型 
检查 的 透彻 讨论 。 


吉 布 斯 抽样 以 及 其 他 计算 方法 


最 后 这 部 分 所 用 的 计算 方法 是 本 着 简单 而 精确 的 手段 去 做 数值 积分 。 依 照 
这 个 方法 ， 我 们 采取 以 下 步骤 : 

1. EFEM 等 分 ? 的 可 能 值 ， 即 r。，m =1，…，M。 

2. 为 有 限制 的 似 然 值 编制 计算 程序 (方程 13.31) 。 

3. 基于 这 个 似 然 值 进行 7 的 推断 。 例 如 ， 上 一 个 例子 可 以 通过 寻找 某 一 
能 产生 出 p(7 | d) 的 最 大 值 的 > 值得 到 众 数 。 后 验 均值 的 计算 公式 为 : 





Elr |d} _ er | [13.35] 
> |9) 
其 中 需要 选择 足够 大 的 M 以 确保 可 接受 的 准确 度 。 
4. 与 此 类 伏地 计算 其 他 的 后 验 密度 。 例 如 ,计算 : 
piy |d) Dinesh lra Del [a [13.36] 


E” pld 


5. 当 需 要 时 ， 计 算 所 关注 参数 的 均值 和 方差 。 
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当 问题 很 简单 并 且 为 7 和 ? 选择 了 均匀 先 验 分 布 时 ， 这 个 方法 的 效果 很 
好 然而， 在 大 多 数 情况 下 ，r 和 会 是 多 维 的 。 此 外 ， 重 要 的 是 能 够 研究 为 
7 和 Y 所 选择 的 先 验 分 布 的 推断 的 敏感 性 ， 以 上 所 描述 的 图 示 法 虽然 简单 ， 但 
对 于 理解 贝 叶 斯 推断 的 逻辑 很 有 用 ， 可 是 当 模 型 变 得 更 复杂 必须 研究 更 广 范围 
的 先 验 分 布 时 ， 这 个 方法 就 行 不 通 了 。 

在 过 去 的 15 年 里 ， 统 计 学 家 发 展 了 一 套 精巧 的 计算 方法 ， 可 以 通过 用 基 
于 现行 参数 估计 的 模拟 数据 来 扩充 观测 数据 的 途径 以 很 好 地 近似 计算 后 验 分 
布 . 这 些 方法 被 总 称 为 数据 增 广 法 (Tanner & Wong，1987) ， 其 中 一 个 特例 是 
吉 布 斯 抽样 器 (Gibbs sampler, Geman & Geman, 1984; Gelfand & Smith, 
1990) 。 我 们 来 示范 一 下 这 个 方法 如 何 应 用 于 第 6 章 所 述 的 词汇 量 增长 的 简单 
例子 。 


将 吉 布 斯 抽样 器 应 用 于 词汇 量 增长 数据 


这 些 数 据 对 贝 叶 斯 分 析 而 言 是 特别 适宜 的 ， 因 为 有 比较 少 的 高 层 单位 (22 
个 孩子 )， 还 因为 这 个 数据 有 些 不 平衡 。 事 实 上 ， 在 第 一 个 研究 中 只 有 一 半 的 
孩子 参与 ， 研 究 人 员 做 了 六 七 次 观测 。 而 另 一 半 的 孩子 参与 了 第 二 个 研究 ， 研 
究 人 员 只 观测 了 三 次 。 在 这 么 小 的 样本 规模 下 ， 数 据 又 如 此 不 平衡 ， 我 们 担心 
的 是 对 层 -2 方差 的 不 精确 估计 会 导致 对 层 -1 和 层 -2 回归 系数 估计 的 不 精 
确 。 在 第 6 章 已 举例 说 明 ，REML 方法 估计 上 的 不 精确 性 不 能 在 这 些 回归 系数 
的 标准 误 报告 中 显示 出 来 。 

模型 。 这 一 模型 简要 概括 于 表 13.2 中 。 这 里 ， 我 们 用 了 上 比 第 6 章 更 为 简 
洁 的 表达 式 a, = (age -12) 。 在 层 -1， 只 有 一 个 预测 变量 。 层 - ! 模型 中 没 
ARH (回顾 当 孩 子 12 SAR, 年龄 的 截 距 和 线性 系数 都 为 零 ) ， 因 而 ， 
层 -1 只 有 系数 表示 加 速度 7,。 


表 13.2 词汇 量 增长 数据 的 贝 叶 斯 模型 (Seltzer, 1993) 





层 -1 模型 ( 似 然 值 ) 





Y, ETa teys es ~N(0,0°}) 


be ead Rey Pd 
eee 
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续 表 13. 2 





层 -2 模型 (第 一 阶段 的 先 验 分 布 ) 


a 
万 | =By + EB Aotu, = XB +u,, u, -~ N(0.7) 
* 





-œ <f <> 
0s7<% 
2 2 
eol Oco <a 


p(B. tr.) = pl Bp tiple’) 


联合 后 验 分 布 





pim Bra |Y) ap ir Brg) xr tB., ly) 
=palB | t.0°,9.¥) xra(T.0 ,nm | Y) 
=p,(r' | B.o* m, Y) xr (Bo ,nm | Y) 


= Plo | B.r., Y) xroif 甩 ,7.7 | Y) 





在 层 -2， 这 个 加 速度 由 3 个 在 孩子 层次 的 自 变量 来 预测 : Xi, 是 分 组 属性 
(对 参加 第 一 个 研究 的 孩子 有 X =0， 对 参加 第 二 个 研究 的 孩子 有 =1); 
Xau = 母亲 的 语言 能 力 ， 即 当 孩 子 16 个 月 时 母亲 所 用 所 有 词汇 量 的 自然 对 数 ; 
45 是 孩子 性 别 的 标识 变量 (, = 1 ROKK, X, =0 表示 男孩 ) 。 这 些 自 变量 


可 以 被 收集 在 一 个 向 量 中 ， 即 ; 
X = (1,2,,.%, fe 


与 此 类 似 ，B 便 是 层 -2 回归 系数 的 4 x 1 阶 向 量 。 
正如 上 述 教师 期 望 值 数据 的 情况 一 样 ， 贝 叶 斯 方法 将 层 - 1 模型 表述 为 似 


然 值 ， 即 在 给 定 参 数 > 和 o 的 前 提 下 描述 观测 数据 Y 的 分 布 。 更 为 具体 地 
说 ， 这 个 似 然 值 用 正 态 密度 给 出 : 
SY | ro3) = (200°) ?exp{ - 5 Su, - 7,0,)'/(20*) } 


其 中 T= ZT. 
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在 贝 叶 斯 方法 的 术语 中 ， 层 -2 模型 是 第 一 阶段 的 先 验 分 布 ， 而 且 还 是 正 
态 的 ， 有 密度 为 : 


pla |B,7) = (27r) expf- F (r, -XIB)' (27)} 


第 二 阶段 的 先 验 分 布 为 p(B，y，o*)， 是 由 表 13.2 得 出 的 具体 先 验 的 
RA, 
吉 布 斯 抽样 器 。 所 有 参数 的 联合 密度 是 其 似 然 值 、 第 一 阶段 的 先 验 分 布 、 
第 一 阶段 的 先 验 分 布 的 乘积 。 对 于 给 定 的 数据 ， 这 些 未 知 参数 的 后 验 密度 与 该 
密度 成 比例 ( 见方 程 13. 16) 。 于 是 我 们 有 : 
pin. B.T, | ¥) < f(¥ | m, pla | B,7)p(B,7.0°) 


但 是 ， 未 知 参数 的 密度 也 可 以 表达 为 条 件 密 度 的 乘积 。 吉 布 斯 抽样 利用 了 这 样 
一 个 事实 ， 即 利用 了 联合 密度 的 四 种 表达 式 之 间 的 等 量 关 系 : 


P(m,Br,oz|y) = p(w {B,7.0°,¥) xr, (B,7,0° |Y) 
= pa(B|r,o m, Y) x1, (7.07.9 | Y) 
= p,(r' |B. ,my) xr, (B.n |Y) 
= palo’ ipB,r,r,y) x roz(B,mrr|y) 


具体 而 言 ， 吉 布 斯 抽样 利用 的 是 ,我们 可 以 容易 地 对 全 部 条 件 p, Pa p, 和 
Ps: 抽样 ， 因 为 其 中 的 每 一 个 都 有 已 知 形式 。 表 13. 2 中 设置 每 一 个 的 具体 形 
式 。 吉 布 斯 抽样 的 创造 性 在 于 : 即使 相应 的 密度 r, 、rs、r, 和 "的 形式 未 知 ， 
我 们 也 能 近似 求 出 所 有 未 知 量 的 后 验 密度 。 

SR, RU Mew IT Bc Mo FR, PM, RTA] REML 
方法 ， 利 用 这 些 初始 估计 值 ， 我 们 从 p, 中 抽样 以 取得 r”, EA, RGAN 
这 一 mw"" WAA rO Mo 的 值 ， 再 从 ps 中 抽样 以 得 到 Bp""。 然 后 ， 我 们 将 
oz 、B 和 和 插入 P 以 求 出 r" ,这 个 基 的 倒数 就 是 7" 。 再 往 后 ， 我 
Mr, OAT 插入 p。: 中 就 得 到 了 ogo" ， 这 个 量 的 倒数 就 是 nx 。 这 
就 完成 了 吉 布 斯 抽样 器 的 第 一 步 迭 代 。 

不 断 重复 这 个 过 程 ， 直 至 达到 随机 收敛 .了 Seltzer 等 人 (2001) 及 Cowles 


DO 当 上 随后 一 轮 的 算法 可 以 被 认为 是 从 联合 后 验 分 布 进行 随机 抽取 时 ， 就 是 随机 收效 了 。 监控 吉 布 斯 抽 
宰 缆 的 收 伍 是 当前 受到 密切 关注 的 研究 课题 ， 而 评价 收 煞 的 规则 的 讨论 已 经 超出 了 本 章 的 讨论 范围 
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和 Carlin (1996) 描述 过 监控 收敛 的 一 些 办 法 。 在 达到 收敛 后 ， 便 将 从 附加 的 
m 次 迭代 取得 的 数值 保存 下 来 - 这 些 未 知 参 数 的 m 个 值 的 经 验 分 布 就 被 当 作 
真正 联合 后 验 分 布 的 近似 值 : 假定 普 很 大 ,任何 未 知 和 其 的 边缘 后 验 分 布 都 能 
够 由 寺 布 斯 抽样 器 产生 的 这 一 未 知 量 的 m 个 值 的 经 验 分 布 作为 近似 。 在 本 例 
中 ，m =19000。 有 关 细 节 请 参见 Seltzer (1993) 的 论文 


表 13.3 吉 布 斯 抽样 所 需 的 条 件 分 布 




















分 布 分 布 类 型 sw 
ee * | x 
| =A + (A) XIB 
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palB | 2.0? mY) N(B* Vg) fF CEMA Bier 
| Ve EXA) 
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结果 。 表 13. 4 对 由 吉 布 斯 抽样 器 和 贝 叶 斯 方法 所 估计 的 层 -2 系数 结果 
与 基于 REML 的 估计 结果 进行 了 比较 (后 一 结果 曾 在 第 6 章 中 展示 过 ) 。 我 们 
看 到 ,它们 的 点 估计 值 几乎 完全 相同 。 然而， 每 一 参数 的 贝 叶 斯 95% 置信 区 
间 都 稍微 比 REML 方法 估计 的 相应 区 间 要 宽 些 。 这 个 扩大 的 结果 是 因为 REML 
区 间 并 未 反映 出 由 于 7 未 知 而 导致 的 p 的 不 确定 性 ， 而 贝 叶 斯 区 间 却 反映 了 这 
个 额外 的 不 确定 性 。Seltzer 提供 了 对 7 后 验 分 布 的 图 示 。 它 略 呈正 偏 态 ， 所 以 
7 有 较 大 的 合理 取 值 范围 就 处 于 众 数 的 右 侧 (这 与 REML 点 估计 是 对 应 的 )。 
这 一 事实 被 REML 所 忽视 ， 而 在 贝 叶 斯 方法 中 却 受到 考虑 。 贝 叶 斯 方法 对 加 速 
BE m, 的 区 间 估 计 也 比 基 于 REML 条 件 的 经 验 贝 叶 斯 方法 相应 的 估计 值 要 大 。 


D 译注 : 原 书 中 只 提供 了 论文 标题 和 期 导 、 页 码 ， 未 提供 刊物 名 称 。 
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#134 REML 方法 与 贝 叶 斯 方法 对 层 -2 系数 推断 的 对 上 比 

















REML 方法 利用 吉 布 斯 抽样 的 贝 叶 斯 方法 
模型 套数 — — — — Pa 一 - — — — 
系数 se 9%5% 置 信 区 间 系数 se 95% 置信 区 间 
RE, pa — -4.92 2.84 ( -10.50,0.66) -4.89 3.22 ( -11.25,1.50) 
分 组 ，B， -1.11 0.30 (-181,-040) -1.1 0.41 ( -1.94, -0.30) 
AE RAIN ATED). 6. 0. 89 0.36 (0. 18,1. 59) 0. 88 0.41 (0.07,1. 70) 
Kh. By 0. 80 0.38 (0.061. 55) 0. 80 0.43 ( -0.07,1.68) 


在 前 面 几 章 ， 对 分 层 模 型 的 推断 都 建立 在 EB - ML 或 EB - REML 方法 之 
上 。 应 用 EB - ML 方法 的 分 层 模 型 将 对 方差 协 方差 成 分 和 固定 回归 系数 的 推断 
建立 在 最 大 似 然 估 计 的 基础 上 。 随 机 系数 的 EB 推断 是 建立 在 给 定数 据 与 其 他 
参数 的 ML 估计 的 条 件 分 布 基础 之 上 。EB - REML 方法 与 它们 的 关系 很 紧密 ， 
在 这 里 ， 对 协 方差 成 分 的 推断 是 基于 REML 方法 得 到 的 ， 而 对 固定 问 归 系数 和 
随机 回归 系数 的 EB 推断 是 基于 给 定 的 数据 以 及 给 定 的 协 方差 成 分 的 REML 估 
计 得 到 的 。 

EB - ML 和 FEB - REML 在 J ( 较 高 层 里 的 单位 数 ) 很 大 时 效果 很 好 。 即 使 
在 /很 小 时 ， 只 要 数据 不 是 过 于 不 平衡 ， 这 种 方法 的 固定 效应 和 协 方差 成 分 的 
估计 也 还 是 很 好 的 。 

然而 ， 当 了 很 小 并 且 特 别 是 当 数 据 不 平衡 时 ， 应 用 完全 贝 叶 斯 方法 就 会 有 
明显 的 优势 。 应 用 这 一 方法 时 ， 对 任 一 未 知 量 的 推断 都 会 完全 考虑 到 其 他 所 有 
未 知 量 的 不 确定 性 。 不 过 ， 其 结果 对 于 先 验 分 布 的 选择 可 能 比较 敏感 。 

先 验 概率 分 布 ， 表达 了 研究 者 在 收集 新 数据 之 前 对 某 些 未 知 参 数 合理 值 的 
设想 。 

似 然 : 将 样本 数据 的 似 然 值 作 为 一 个 未 知 参数 值 的 函数 加 以 表达 。 

后 验 概率 分 布 : 获取 了 数据 以 后 ， 研 究 者 对 未 知 参 数 合理 值 设 想 的 表达 。 
后 验 概率 分 布 是 先 验 信 息 与 样本 信息 的 结合 。 

后 验 区 间或 可 信 区 间 : 在 考查 了 观测 数据 之 后 对 未 知 参数 处 于 某 一 区 间 之 
内 的 概率 表达 。 

FRG: 可 以 通过 计算 其 后 验 概率 并 将 此 概率 与 某 个 备 择 假设 的 后 验 概率 
进行 比较 来 做 检验 。 
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本 章 讨 论 了 统计 推断 的 4 种 方法 : 

1. EB -ML (emperical Bayes with maximum likelihood) 方法 。 在 给 定 了 固 
定 系数 和 协 方差 参数 后 ， 对 随机 系数 进行 先 验 分 布 的 设 壮 。 但 是 ， 其 团 定 系 数 
和 协 方差 成 分 并 没有 给 予 先 验 分 布 ， 而 是 通过 最 大 似 然 估计 (ML) 方法 对 其 
进行 估计 。 在 假定 未 知 冉 定 系数 和 协 方差 成 分 与 其 ML 估计 值 相等 的 条 件 下 ， 
将 随机 系数 的 推断 建立 在 其 后 验 分 布 基础 之 上 。 

2. EB ~ REML (emperical Bayes with restricted maximum likelihood) 方法 。 
对 随机 系数 和 固定 协 方差 设置 先 验 分 布 ， 但 是 并 没有 对 协 方差 成 分 设置 先 验 分 
布 ， 而 是 用 REML 方法 去 估计 这 些 成 分 。 对 随机 系数 和 固定 系数 的 推断 建立 在 
它们 的 联合 后 验 概率 分 布 上 ， 其 中 假定 未 知 的 协 方差 成 分 与 其 REML 估计 值 
相等 。 

3. 完全 贝 叶 斯 推断 。 对 所 有 未 知 数 设 置 先 验 分 布 ， 其 中 不 仅 包括 随机 系 
数 和 固定 系数 ， 而 且 也 包括 协 方差 成 分 。 因 此 ， 其 推断 是 建立 在 给 定数 据 条 件 
下 所 有 未 知 数 的 联合 分 布 上 。 

4. 吉 布 斯 抽样 是 当 后 验 分 布 不 能 够 被 直接 估计 时 ， 一 种 近似 估计 后 验 分 
布 的 策略 ， 它 实际 上 是 分 层 模 型 的 一 般 情 况 。 通 过 对 精心 定义 的 条 件 分 布 进行 
序列 抽样 ， 通 过 每 一 次 迭代 ， 产 生 从 近似 联合 后 验 分 布 中 抽取 的 一 套 样本 。 经 
过 多 次 迁 代 〈 这 一 过 程 被 称 为 随机 收敛) 后 ， 其 后 续 的 抽取 样本 便 可 以 收集 
起 所 关注 的 后 验 分 布 的 表现 。 


ERES 


An O 
DY RE RR 


IZ 


估计 理论 


e 模型 、 估 计 方 法 及 算法 

© 最 大 似 然 估计 与 贝 叶 斯 估计 的 综述 
© 对 两 层 分 层 线性 模型 做 最 大 似 然 估计 
。 基于 期 望 最 大 化 的 最 大 似 然 估 计 

。 基于 费 会 尔 得 分 的 最 大 似 然 估计 

© 多 元 分 层 线 性 模型 中 的 最 大 似 然 估计 
© 分 层 一 般 化 线性 神 型 的 估计 

© 总 结 与 结论 


模型 、 估 计 方 法 及 算法 


对 分 层 模型 做 方法 论 选择 时 ， 必 须 牢记 下 面 三 个 概念 之 间 的 区 别 : 模型 、 
估计 理论 与 计算 方法 。 模 型 用 来 定义 所 要 研究 的 总 体 参 数 ; 估计 理论 使 我 们 能 
够 根据 抽样 数据 统计 推断 总 体 参数 ; 而 计算 方法 则 是 估计 理论 的 实施 。 模 型 的 
确定 需要 几 个 关键 选择 : 分 层 结构 中 的 层 数 ， 各 层 的 解释 变量 ， 在 各 层 有 所 变 
化 的 变量 的 概率 分 布 ， 以 及 最 合适 的 连接 函数 ( 它 将 期 望 结果 与 一 套 解释 变 
量 联系 在 一 起 ， 详 见 第 10 章 ) 。 如 果 选 定 模型 ， 我 们 就 可 以 考虑 选择 不 同 的 估 
计 方 法 ， 包 括 : 最 大 似 然 估计 (ML)、 约 束 最 大 似 然 估计 (REML) 以 及 贝 叶 
斯 估计 方法 ( 见 第 13 章 )。 对 于 大 样本 数据 而 言 ， 这 三 种 方法 所 得 的 结果 基 
本 一 致 ， 但 对 小 样本 数据 来 说 结果 就 会 有 所 不 同 。 
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最 后 ， 选 定 了 估计 理论 ， 我 们 就 需要 一 种 计算 方法 。 如 果 我 们 选择 最 大 似 
然 估计 ， 那 么 我 们 就 需要 使 似 然 值 最 大 。 在 有 些 情况 下 ， 这 可 以 通过 简单 评估 
一 个 公式 来 完成 。 但 在 许多 情况 下 ， 并 不 存在 完整 表达 式 来 保证 似 然 值 最 大 ， 
因此 就 需要 用 某 种 迭代 方法 。 通 常 的 选择 包括 : 期 望 最 大 化 (expectation-maxi- 
mization, EM) 算法 (Dempster, Laird, & Rubin, 1977; Dempster, Rubin, & 
Tsutakawa, 1981); $4 4K 494} (Fisher scoring, Longford, 1987); 以 及 迭代 
一 般 最 小 二 乘法 (iterative generalized least squares, IGLS, Goldstein, 1986). 
原则 上 ， 在 给 定数 据 、 给 定 模型 后 任何 一 种 算法 应 该 得 到 相同 的 结果 。 然 而 ， 
不 同 算法 的 效果 包括 收敛 速度 以 及 收敛 的 可 靠 性 等 有 所 不 同 。 

表 14.1 总 结 了 本 书 中 所 用 到 的 模型 、 估 计 方 法 及 算法 。 例 如 ， 在 第 1 ~ 
7 章 中 详细 描述 了 两 层 分 层 线性 模型 。 我 们 可 能 选择 完全 最 大 似 然 估计 或 约 
东 最 大 似 然 估 计 ( 见 第 3 章 和 第 4 章 中 的 讨论 ) ， 不 管 选 定 哪 一 种 ， 我 们 既 
可 以 采用 期 望 最 大 化 (EM) 算法 ， 也 可 以 采用 费 舍 尔 得 分 来 实施 ， 同 时 我 
们 也 可 以 选择 贝 叶 斯 估计 来 进行 推断 ， 但 这 时 就 不 能 用 期 望 最 大 化 算法 或 费 
会 尔 得 分 了 。 通 常 ， 贝 叶 斯 估计 的 算法 采用 第 13 章 中 提 到 的 吉 布 斯 抽样 。 
对 于 三 层 模 型 或 多 变量 模型 ， 也 可 以 这 样 选择 ， 尽 管 我 们 在 本 书 中 仅 示 范 了 
完全 最 大 似 然 合计 法 。 第 10 章 阐述 了 一 般 化 分 层 线性 模型 ， 它 用 的 是 惩罚 
性 准 似 然 (penalized quasi-likelihood) 估计 和 完全 最 大 似 然 估 计 法 。 


这 14.1 本 书 中 用 到 的 模型 、 估 计 方法 及 算法 


模 型 估计 方法 算 法 
分 层 线性 寞 型 (两 层 ) 完全 最 大 伏 然 估计 期 望 最 大 化 算法 或 费 会 尔 得 分 




















SRR AKA 期 望 最 大 化 算法 或 费 合 尔 得 分 
贝 叶 斯 估计 吉 布 斯 抽样 
分 层 线性 模型 (=E) 完全 最 大 似 然 估 计 期 望 最 大 化 算法 或 费 合 尔 得 分 
交互 分 类 ， 多 变量 模型 
一 般 化 分 层 线性 模型 EEE RA it 用 重新 估计 的 权重 进行 选 代 的 期 望 
(Bit = ee) 最 大 化 算法 或 费 合 尔 得 分 
完全 最 大 似 然 估计 黄 合 尔 得 分 的 拉 普 拉 斯 近似 





在 本 章 ， 我 们 将 以 用 最 大 似 然 估 计 法 为 基础 的 两 层 模型 为 例 ， 考 察 估 计 方 
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法 和 算法 。 本 章 的 主要 目的 是 海 清 一 些 关键 的 区 别 ， 这 些 问题 在 选择 合适 
的 方法 来 分 析 分 层 数 据 时 经 常 碰 到 。 我 们 的 讨论 通过 所 选 的 应 用 实例 来 说 
明 其 中 的 关键 原则 。 更 为 综合 性 的 解释 ， 包括 表 14. 1 中 所 列 的 模型 与 方 
法 ， 都 可 以 在 下 面 的 网 站 (www. ssicentral. com) 里 看 到 。 然 而 ， 即 使 是 
更 综合 的 解释 ， 也 未 能 穷尽 所 有 的 可 能 。 例 如 ， 它 并 没有 讨论 取得 似 然 值 
最 大 化 的 牛顿 -拉夫 森 (Newton-Raphson) 算法 ， 具 体内 容 请 参见 
Lindstrom 和 Bates (1989) 的 论文 。 同 时 ， 它 也 没有 考虑 到 一 般 化 分 层 线 
性 模型 中 用 到 的 贝 叶 斯 推断 ， 具 体 请 参见 Zeger 和 Karim (1991) 的 论文 。 
然而 ， 在 线 文 件 并 未 包括 三 书 中 所 有 的 例题 ， 而 是 对 估计 和 算法 提供 了 一 
个 更 为 广泛 的 罗列 。 

本 章 将 首先 讨论 分 层 模型 的 估计 所 涉及 的 一 般 性 问题 。 这 个 问题 在 分 层 线 
性 模型 中 比 在 一 般 化 分 层 线性 模型 中 更 容易 解决 ( 见 第 10 章 ) ， 因 此 我 们 先 
考察 标准 的 两 层 分 层 线性 模型 ; 然后 ， 我 们 再 考察 有 多 元 结果 的 分 层 线性 模 
型 ; 最 后 ， 我 们 再 来 完成 最 具 挑 战 性 的 任务 ， 即 估计 一 般 化 分 层 线性 模型 的 
参数 。 


最 大 似 然 估计 与 贝 叶 斯 估计 的 综述 


本 书 所 述 的 分 层 线性 模型 在 第 一 层 中 有 便 等 连接 函数 并 在 每 一 层 有 多 元 正 
态 分 布 。 与 此 相反 ， 一 般 化 分 层 线性 模型 所 涉及 的 是 第 一 层 中 有 非 线性 连接 函 
数 和 非 正 态 分 布 的 数据 ， 而 在 其 他 层 中 则 有 随机 效应 的 多 元 正 态 分 布 。 为 分 层 
线性 模型 找到 好 的 算法 比 一 般 化 分 层 线性 模型 要 容易 得 多 。 这 对 于 最 大 似 然 估 
计 和 贝 叶 斯 估计 来 说 是 一 样 的 。 


BAIA te tt 


FEDER PEER KG RATER: 第 一 ， 要 求 一 个 积分 ; 第 
二 ， 使 积分 最 大 化 。 对 于 分 层 线性 模型 ， 对 一 个 闭 型 公式 求 积分 比较 容易 。 但 
对 于 一 般 化 分 层 线性 模型 ， 积 分 就 只 能 是 近似 的 。 近 似 的 准确 性 将 会 影响 所 选 
算法 取得 似 然 值 最 大 化 的 效果 。 

RY MRA TRA -1 的 结果 变量 ， 设 4 向 量 包 括 层 -2 及 更 高 层 的 
所 有 随机 效应 ， 设 w 向 量 包含 所 有 待定 参数 ( 即 所 有 的 方差 协 方差 元 素 和 所 有 
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被 关注 的 固定 的 回归 系数 )  ， 然 后 我 们 用 /(Y|u，w) 表示 在 给 定 随机 效应 和 
参数 层 -1 结果 时 的 概率 分 布 。 更 高 层 的 模型 则 用 p(u | w) 表示 在 给 定 参 数 时 
随机 效应 的 概率 分 布 。 在 仅 给 定 参数 时 数据 的 似 然 值 是 : 


UY |w) = [AY | urw)plu | w)du (14.1) 


最 大 似 然 估计 的 目的 就 是 使 方程 14.1 关于 w 的 积分 最 大 ， 以 便 能 够 对 w 进行 
推断 。 这 个 积分 对 分 层 线性 模型 来 说 很 容易 估算 ， 因 此 剩 下 的 问题 就 是 如 何 使 
它 最 大 化 。 而 对 于 一 般 化 分 层 线 性 模型 ， 积 分 与 最 大 化 都 比较 困难 。 

对 随机 效应 u 的 经 验 贝 叶 斯 估计 是 根据 其 给 定数 据 Y 和 参数 w 的 最 大 似 然 
估计 值 w 时 的 条 件 后 验 分 布 。 应 用 贝 叶 斯 定理 ， 我 们 有 : 


p(u| y,G) = LO |uo)p(u lw) (14.2) 


fr Y | ua)pte | ó)du 


贝 叶 斯 推断 


贝 叶 斯 方法 结合 了 先 验 信 息 和 数据 信息 来 支持 统计 推断 。 利 用 贝 叶 斯 方 
法 ， 所 有 被 关注 的 未 知 变量 的 信息 都 包含 于 联合 后 验 分 布 ， 即 在 给 定数 据 后 未 
知 变量 的 条 件 分 布 。 我 们 现在 将 方程 14. 2 做 一 些 修 改 ， 为 参数 加 上 一 个 先 验 
概率 分 布 p(w) (并 不 以 菜 一 点 估计 为 条 件 ) ， 然 后 再 应 用 贝 叶 斯 定理 ， 有 : 


pu = Tlou lopo) [14.3] 


{fA x | u,@)p(u | w)p(w)du dw 


在 推断 儿 个 被 关注 的 未 知 变量 的 子 集 时 ， 可 以 通过 对 方程 14. 3 中 辅助 未 知 变 
最 进行 积分 得 到 。 如 果 人 参数 w 是 首要 被 关注 的 ， 那 么 就 有 : 


p(w |¥) = fonw | Y)du [14.4] 
如 果 随 机 效应 u 是 我 们 的 基本 兴趣 所 在 ， 那 么 就 有 : 


plu | Y) = [plu,w | Y)dw [14.5] 


中 ”在 前 几 章 中 ， 我 们 用 粗 体 来 标注 向 蚌 和 矩阵。 本 章 为 方便 起 见 不 再 将 其 标注 为 粗 体 - 
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一 般 来 说 ， 无 论 是 对 分 层 线性 模型 还 是 对 一 般 化 分 层 线性 模型 ， 都 不 能 评 
估 方 程 14.3、14.4 和 14.5 的 积分 。 然 而 ， 它 们 可 以 通过 采用 吉 布 斯 抽样 来 取 
得 近似 值 。 因 为 第 13 章 已 经 描述 了 这 种 方法 ， 本 章 就 不 再 进一步 讨论 贝 叶 斯 
推断 或 吉 布 斯 抽样 。 


对 两 层 分 层 线性 模型 做 最 大 似 然 估计 


在 本 节 中 ， 我 们 将 考察 对 两 层 的 单 变量 分 层 线性 模型 做 最 大 似 然 估计 ， 也 
就 是 说 ， 模 型 只 有 一 个 层 - 1 结果 变量 ， 而 且 层 - 1 有 恒 等 连 接 函 数 ， 而 层 -2 
则 有 服从 多 元 正 态 分 布 的 随机 效应 。 为 了 使 似 然 值 最 大 ， 我 们 就 面临 算法 的 选 
择 ， 即 考虑 采用 期 望 最 大 化 算法 还 是 费 舍 尔 得 分 。 我 们 将 证 明 ， 对 这 些 模型 来 
说 ， 采 用 费 舍 尔 得 分 与 采用 选 代 一 般 最 小 二 乘法 是 等 价 的 。 

对 于 这 些 模型 ， 期 望 最 大 化 算法 与 费 舍 尔 得 分 两 者 之 间 有 紧密 联系 。 期 望 
最 大 化 算法 的 每 一 步 都 需要 (在 给 定数 据 和 当前 参数 估计 的 情况 下 ) 计算 随 
机 效应 的 条 件 均值 的 离 差 平方 和 与 交互 乘积 和 ， 同 时 也 需要 计算 这 些 随机 效应 
的 条 件 方差 和 协 方差 。 下 面 将 会 表明 ， 费 舍 尔 选 代 涉及 对 期 望 最 大 化 算法 的 这 
一 步 做 了 一 种 转换 ， 因 此 也 有 赖 于 同样 的 条 件 均值 与 协 方差 怎 阵 。 


基于 期 望 最 大 化 的 最 大 似 然 估计 


在 本 节 中 ,我们 将 考虑 对 两 层 分 层 线性 模型 进行 完全 信息 的 最 大 似 然 估 
计 。 如 果 需 要 了 解 这 种 方法 与 约束 最 大 似 然 估 计 的 异同 ， 我 们 建议 读者 查看 网 
站 www. ssicentral com。 期 望 最 大 化 算法 在 处 理 似 然 值 最 大 化 时 是 将 这 一 问题 
视 为 缺失 数据 问题 。 


模型 


层 -1 模型 为 ; 
Y, = XB +r, r;~ N(0,0°!) [14.6] 


其 中 ,，Y, 是 一 个 nx1 阶 的 结果 向 量 ; X, 表示 已 知 层 - 1 自 变量 的 n x 8 BPH 
阵 ; Be Ox 阶 的 层 ~1 系数 向 量 ; 而 r, Bn, x1 阶 的 随机 效应 的 向 量 ， 并 假 
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定 这 些 随机 效应 都 服从 多 元 正 态 分 布 ， 其 中 的 均值 向 量 为 0、 而 协 方差 矩阵 为 
ol, kB, 1B n xm 阶 的 特征 矩阵 。 层 -2 中 的 单位 j=1，…，J 都 是 独 
立 的 。 

在 层 -2 中 , 层 -1 系数 就 成 了 结果 变量 : 


B, = Wy +u, u ~ N(0,7) [14.7] 
其 中 ，W, 是 已 知 的 层 -2 自 变量 的 Q xy 阶 向 量 ; y 是 固定 效应 的 /x1 阶 向 量 ; 
而 u 是 层 -2 随机 效应 的 8 x 1 阶 向 量 ， 且 假设 它们 都 服从 均值 向 量 为 0、 协 
方差 矩阵 为 了 的 多 元 正 态 分 布 。 
将 层 -2 模型 代入 层 -1 模型 ， 即 得 到 一 个 组 合 模型 : 


Y, = X Wy + Xu, +r [14.8] 


这 种 组 合 模型 的 一 种 特殊 情况 是 : 
Y, = AsO; + 4,6, * f 
8, ~ N(0,T) [14.9] 
r, ~ N(0,07f) 
其 中 ，45 =X W, 8 =y，4, = 局，9 = wj。 这 种 混合 模型 比方 程 14. 8 所 表示 的 
组 合 模型 更 一 般 化 ， 因 为 它 并 不 要 求 每 一 个 层 - 1 系数 都 有 一 个 随机 分 量 ， 所 
以 ,在 许多 应 用 中 4, 是 含 随机 效应 的 的 一 个 子 集 ， 而 在 另外 一 些 应 用 中 A, 
则 可 以 包括 没有 随机 效应 的 变量 。 


最 大 化 步骤 (M-Step) 


期 望 最 大 化 算法 认为 y 是 观察 数据 而 bj 是 缺失 数据 ， 因 此 ， 完 整 的 数据 
MBE: (Y, 0,), j=1, =, J, BPO, o 和 了 都 是 需要 被 估计 的 参数 。 

如 果 观 察 到 的 是 完整 数据 ， 那 么 求 出 最 大 似 然 估 计 就 比较 简单 。 为 了 估计 
br， 方 程 14. 9 两 边 同时 减 去 4,9,; 即 可 得 到 : 


Y, - A,0, = 4,0, +r, 
可 以 证 明 最 小 二 乘法 估计 : 


ê, = ($ 454p) EAO, - A,0,) [14. 10) 
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“完整 数据 ”4 的 最 大 似 然 估计 。 
同样 ， 对 完整 数据 的 7 和" 的 最 大 似 然 估计 公式 也 很 简单 : 


Fer Los, 
o=N' ye F, [14.11] 


= N'Y (Y, - 4,6, - 4,0,) "CY, - 456, ~ 4,0,) 
i L oo p] Ct 79 


HH, N= Yn, 

这 种 推导 定义 了 完整 数据 的 充分 统计 量 (complete-data sufficient statistics, 
CDSS) ， 即 如 果 观 测 到 的 是 完整 数据 ， 那 么 对 8. TH 的 统计 量 都 是 充分 
的 。 它 们 分 别 是 : 


Dane, Lee. Lae, DONAM 4121 
FAB BRS MR (E-Step) 


如 果 给 定 了 数据 并 且 从 前 面 的 迁 代 中 可 以 得 到 参数 估计 的 话 ， 即 使 是 完整 
数据 的 充分 统计 量 (CDSS) 并 没有 被 观测 到 ， 我 们 也 可 以 根据 它们 的 条 件 期 
望 来 估计 。Dempster 等 人 的 论文 (1977) 说 明 ， 用 完整 数据 的 充分 统计 期 望 
值 代 入 最 大 化 步骤 的 公式 便 可 以 产生 一 个 新 的 参数 估计 值 ， 并 且 它 比 现 有 估计 
值 具有 更 大 的 似 然 值 。 

RH E(CDSS|Y, 6,, T, o°) BEERE Y, bn T, o, 的 条 件 下 推导 缺 
失 数据 9, 的 条 件 分 布 。 根 据 方程 14. 9 可 知 ， 这 种 完整 数据 的 联合 分 布 为 : 


CAC Le 


由 此 ， 给 定 完整 数据 时 缺失 数据 的 条 件 分 布 为 : 
0, | ¥,0,,T,0° ~ N(0; ,o°C,') (14, 14] 
其 中 : 


0 = Cr "ALCY, - 450) 
te [14.15] 


C, = AA 
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证 明 。 根 据 标准 正 态 分 布 理 论 (参见 Morrison，1967， 第 88 页 ) ， 从 联合 
分 布 (方程 14. 13) 推导 出 给 定 Y 时 9, 的 条 件 分 布 为 : 


E(0, |Y) = 0; = TAT(A,TAT + 0 (7 -4501) [14.16 
且 
Var(b | ¥,) = T- TAI(A TA} + 0°) AT [14.17 


然而 ,根据 Smith (1973) 的 定理 3: 





(A TA, +°) = oT -oA (MA + T) AT [14. 18 
根据 Dempster 等 人 (1981) 的 证 明 ， 我 们 定义 : 


Cit = 0440 + Ta? 


i [14.19] 
ix (ATA, — a Da 
于 是 表明 : 
AGCA TA, i oD) “Ay z o° (44 > AsA, C7 A An) 
= oa (I -A AC ATA, [14.20] 
= 7 CT 474， 
将 方程 14. 20 代入 方程 14. 17， 即 得 到 : 
Var(@, | ¥,) = T -C7'44,T 
= (1-C;'ATA,)T [14.21] 


x CD 
与 此 类 似 ， 定义 d =Y, -45b/， 应 用 方程 14. 18 及 方程 14. 16， 我 们 发 现 : 


0; = Th 71-0 7A,C;'AT)d, 
7A,C;'Ald,) 


oqo 


= oT(Ad - A att 
=o *T(1 - ASA, Co") Atd, 


= Cdrd, 


证 明 结 束 。 
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将 各 部 分 结合 起 来 


在 识别 出 最 大 化 步骤 (M-step) 所 需要 的 完整 数据 的 充分 统计 量 (CDSS) 
以 后 ， 我 们 现在 就 可 以 定义 期 望 最 大 化 算法 (EM algorithm) 。 
1. 估计 完整 数据 的 充分 统计 基 。 我 们 发 现 : 


e| D474,0, | Y,0.0°,7) = 了 474,6; 
E| F000n0,7) = Eoo +0° Fo," [14.23] 
a 5 rir, | ¥,6,,0° T) = x rir + or trace ( x C'A A ) 


JP, r’ =Y, -A0 -4,0; 。 这 些 期 望 值 可 以 根据 以 前 迭代 得 到 的 9,、o* 
和 了 来 求 得 。 

2. 将 估计 的 完整 数据 的 充分 统计 量 (CDSS) 代入 最 大 化 步骤 的 公式 中 
(方程 14. 10 和 14. 11) ， 以 得 到 这 些 参 数 的 新 估计 值 。 

3. 将 这 些 新 的 参数 估计 值 再 代 人 步骤 1 中 。 

4. 重复 上 述 步 又 ， 直 到 (a) 对 数 似 然 值 的 变化 已 经 足够 小 ; RE (b) 任 
一 参数 估计 值 的 最 大 变化 已 经 足够 小 。 

这 种 算法 的 收敛 可 以 通过 计算 每 一 步 迭 代 的 对 数 似 然 值 来 加 以 监测 。 


基于 费 舍 尔 得 分 的 最 大 似 然 估计 


期 望 最 大 化 算法 ， 正 如 前 面 已 讨论 的 运用 在 分 层 线性 模型 中 的 似 然 最 大 化 
一 样 ， 有 着 许多 优点 。 首 先 ， 它 将 可 靠 地 收敛 到 参数 空间 中 的 一 个 局 部 最 大 
值 。 这 意味 着 ， 它 不 会 得 出 一 个 负 的 方差 估计 值 ， 也 不 会 产生 非 正 值 的 协 方差 
矩阵 的 协 方差 和 方差 估计 值 ， 除 非 这 个 模型 过 度 拟 合 极为 严重 ， 以 至 于 计算 过 
程 在 数量 上 极 不 稳定 。 其 次 ， 它 的 计算 比较 容易 推导 ， 也 便于 检验 。 再 次 ， 每 
一 步 的 计算 量 较 小 。 

主要 的 缺点 有 两 个 。 首 先 ， 期 望 最 大 化 算法 的 收敛 速度 较 慢 ， 特 别 是 在 似 
然 值 比较 平坦 时 ， 即 给 定数 据 中 的 参数 存在 很 大 的 不 确定 性 时 。 的 确 ， 期 望 最 
大 化 算法 的 收敛 速率 是 “缺失 信息 ”比例 的 一 个 直接 测度 (Schafer, 1997, 
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第 3 章 )。 其 次 ， 期望 似 然 最 大 化 算法 的 迭代 ， 并 不 能 自动 得 到 作为 副产品 的 
最 大 似 然 估计 值 的 渐 近 标准 误 估 计 。 

为 了 使 分 层 线 性 模型 的 似 然 值 最 大 化 ， 另 一 种 可 选 算 法 是 费 会 尔 得 分 
(Longford，1987，1993)。 这 种 方法 的 主要 优点 有 两 个 : (1) 在 多 数 应 用 场合 
下 它 均 可 快速 收敛 ; (2) 作为 自动 得 到 的 副产品 ， 它 可 以 直接 计算 出 所 有 参数 
估计 的 标准 误 。 但 它 也 有 缺点 : (1) 它 会 产生 非 正 的 方差 协 方差 矩阵 估计 值 ， 
例如 ， 不 可 接受 的 负 的 方差 估计 值 以 及 相关 系数 落 在 ( -1，1) 区 间 之 外 ; 
(2) 对 于 复杂 模型 ( 如 三 层 模 型 ) ， 其 计算 变 得 很 繁琐 。 

比较 了 最 大 似 然 估计 法 中 采用 期 望 最 大 化 和 采用 费 舍 尔 得 分 之 间 的 优 劣 ， 
一 种 较 理性 的 方法 就 是 将 这 两 种 方法 结合 起 来 ( Raudenbush, Bryk, Cheong, 
& Congdon, 2000) 。 我 们 最 初 可 以 做 很 少儿 次 期 望 最 大 化 迭代 ， 一 般 便 能 达到 
最 大 似 然 估计 值 的 邻近 点 。 然 后 再 计算 费 合 尔 估计 。 如 果 费 合 尔 估计 值 落 在 参 
数 空间 之 内 ， 便 可 以 接受 这 个 估计 ， 并 且 计 算 更 多 的 期 望 最 大 化 估计 。 然 后 ， 
再 重新 采用 竟 舍 尔 得 分 。 继 续 这 种 过 程 直到 收敛 为 止 。 


RS RISD ER BRE p ALA 


标注 。 在 提供 计算 公式 之 前 ， 先 解释 一 下 标注 方法 。 首 先 ， 运 算 符 “vec” 
表示 堆栈 一 个 矩阵 的 列 向 量 。 例 如 ， 如 果 了 是 2 x2 REE, WA, 


To 


[14.24] 


vee(T) = ve We ) Ea 


Te Tn 


Th 


其 次 ， 按 以 下 形式 定义 Kronecker 乘积 (有 时 也 称 “ 直 接 乘积 " ) 。 设 


A@B (14. 25} 

其 中 : 
alee (14. 26 
iS wd) 
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auB ve) [14.27] 


A@B= ( 
a,B ayB 


注意 ， 如 果 4 是 m xn RR, WBE p xg EH, PACMNHRARE 


mp xng 阶 矩阵 - 
第 三 ， 我 们 需要 关键 导数 的 结构 。 设 gp 表示 了 中 的 特定 参数 o. BUT 
是 2 x2 阶 和 矩阵。 那么 ， 可 得 wp=(ro，ro，Ti，o) ， 








To 
Tio 
To 
Es dvec(T) _ Th 
op” Iwt Tua) [14. 28) 
1000 
0100 
0100 
00110 
H 
7 ao ðo? 
Be — — 
ag A(T Tio Tm +7 ) (14. 29] 
=(0 0 0 1) 


T, SP 的 费 爹 尔 得 分 。 为 了 应 用 费 合 尔 得 分 的 方法 ,我们 将 层 -2 单位 j 
的 模型 改写 为 


¥,=4,0,+4, d, ~ N(0,¥,) [14.30] 


其 中 , Y 是 nj x1 阶 结果 向 量 ; AE n xf/ 阶 已 知 自 变量 的 矩阵 ; b 是 fx1 阶 
固定 效应 的 向 量 ; 而 由 =4,b,+e， 有 : 

8, ~ N(0,T), e ~ NOoD), V, = A TA; + oT [14.31] 
Ht, AEn 阶 已 知 自 变量 矩阵 ，b 是 0x1 阶 随 机 效应 的 向 量 ，7 是 


Q x 0 阶 随机 效应 协 方差 和 矩阵， 而 /是 n, x n, 阶 特征 矩阵 。 然 后 ， 利 用 Magnus 
和 Neudecker (1988) 的 结果 ， 我 们 发 现 得 分 向 量 3 为; 
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_ Alogi LY, :8,,07 7) 
f ae" [14.32] 
-HESS (o @V,") vee (da -¥,) 


其 中 : 


ð vec( V, 
avech) =- (A, QA JES vee( DF [14.33] 


LC ¥,:6,.07 7) = (2 | ¥,| “expf - Farva} [14.34] 


HFE KHERA, BAC, MERMER MRES (Mag- 
nus & Neudecker, 1988) ; 


vec(ABC) = (C7 @ A)vec( B) [14.35] 


将 这 个 恒等式 应 用 到 方程 14. 32， 即 得 到 : 


9 log[ L(Y,;0,,0°,T)] 
(Md ag 
1 [14.36 
JLE vee AVIVA, = ALY,'A,) 
+ F'[d7 V;*d, - trace(V;')]] 


费 舍 尔 得 分 方法 同样 要 求 二 阶 导 数 E(H) = E(SH,) 的 期 望 矩 阵 ， 其 中 : 


F logl LLY, 39).7,0°)] 

apap" 
aresti) avec(V;) 
p ) omn rA 


E(H,) = 


[14.37] 
- PLEA, @AV;'A,)E 


+ E'vec( A V °A) F + Flvec(ATV,*A,)E 


+ trace( ys )F'F] 


HH, WERE (WH 14.37) 的 计算 公式 为 : 


— 
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ALVA, @ ALVA, = ,CT @ AAC TO 
vec( Ary, 4,) = vec[ TC ATA,C; 7) [14.38] 


trace( V?) = (n - Q)o™* + trace( C'T)? 


其 中 ，Q 是 模型 中 每 一 群 随机 效应 的 个 数 。7 中 各 元 素 和 o” 的 渐 近 标准 误 是 
信息 矩阵 的 逆 矩 阵 中 对 角 线 上 各 元 素 的 平方 根 ， 即 为 矩阵 - [E(H)] “的 对 角 
线 上 各 元 素 的 平方 根 。 

费 舍 尔 得 分 算法 的 工作 需要 计算 校正 因子 Pren - Pas: 


Pree -eu =- [ECH)]'S £14.39) 


Hop, H=2H,, S= 上 5,。 将 这 个 校正 因子 加 到 pws 上 就 可 以 得 到 9... 
费 舍 泵 得 分 和 选 代 一 般 最 小 二 乘法 之 间 的 关系 。 定 义 : 
Y; = vee(ddr - V,) 


r= avec(V.) 


“ ag" [14.40] 
V? = Var(¥) = 2(V,@¥,) 
B’ = Pun - Pus 
费 舍 尔 得 分 算法 与 迭代 一 般 最 小 二 乘法 (CLS) 的 算法 是 等 价 的 ， 它 们 
的 目标 都 是 便 下 面 的 公式 最 小 化 : 


=E - xB) CO - x78") [14.41] 
最 小 化 可 以 通过 每 一 步 迭代 计算 得 到 : 
B= (TVD Oy Vy [14.42] 
然后 再 利用 B”+ pws = pw 来 更 新 了 ， 而 后 再 更 新 V'。 注 意 ， 在 每 一 层 都 是 
线性 模型 的 情况 下 ，X” 并 不 依赖 于 p- 


0, RE RAD. p 和 8, 的 最 大 似 然 估计 都 是 渐 近 独立 的 ， 因 此 ， 费 会 尔 
算法 步骤 可 以 分 别 计算 每 一 个 分 量 。 对 于 o, RNA: 


— å log[ L( Y,36,.0°,T)] 
Er [14.43] 


Ty ty- fy- 
= ARV; Y, - ALV,'A,@, = ATV; "d, 
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及 


E(Hw) = E( Ža) = - Agvs [14.44] 
06, 


WH, = LH, S,= 了 S$。。， 现 在 我 们 应 用 费 舍 尔 得 分 算法 求 出 : 
Os = {~ BEC) "Sy, + Or 
= EANA EAV Y, 


由 此 ， 我 们 再 一 次 看 到 费 舍 尔 得 分 法 与 迭代 一 般 最 小 二 乘法 之 间 的 等 价 。 
6, 中 各 元 素 的 标准 误 可 以 根据 收敛 时 Dr 中 对 角 线 各 元 素 计 算 平方 根来 得 
到 ， 其 中 : 


[14.45] 


4 
Dy = @°( Ý ASA, - Jaa, C;'ATAg) [14.46] 
a 


HEFLMALPHFH RS RATS MBRAKKHEZ MHRA, S 的 分 
BA: 


ATV dd V'A, = 7"(0;0; rt 


ae I 


trace(V/') = (n, - 0) + trace( C'T) [14.47] 
由 Pd = a *(¥, - Ag8, - 4,8; "CY, - A50, - 4,85 ) 


ATV7'A, = ATA CT" 


将 方程 14. 47 中 的 各 个 部 分 结合 起 来 得 到 一 个 很 有 用 的 认识 ， 即 对 o 的 费 舍 

尔 一 迭代 一 般 最 小 二 乘法 结合 的 计算 步骤 其 实 代表 了 期 望 最 大 化 算法 步骤 的 一 
种 变形 。 为 了 能 够 看 清楚 这 一 点 ， 首 先 要 注意 的 是 : 
LANV dd VA, = FAVA; 

= T'S 050;'T' ~ A [14.48] 


ee FIT 


这 最 后 一 步 有 赖 于 单位 矩阵 : 


AAC" = fo TC" [14.49] 
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以 及 定义 
Ty - JC B00 +0°C"') [14. 50) 


适用 相同 的 逻辑 ， 我 们 发 现 : 


ELAV >d, - wace( Ve!) ] = Ne (hy - 07) [14.51] 
Hp: 
Gin = yl D (4 -4,07 "Cd, -4,0;) + trace F AA,G') [14.52] 
多 元 分 层 线性 模型 中 的 最 大 似 然 估计 


我 们 现在 考察 根据 不 完整 数据 计算 的 多 元 正 态 模型 的 估计 。 这 种 模型 可 以 
被 表示 成 这 样 一 种 分 层 模型 ， 即 它 的 第 一 层 描述 的 是 观察 数据 和 完整 数据 之 间 
的 关联 。 更 高 层次 的 模型 则 是 描述 完整 数据 的 分 布 。 第 6 章 描述 了 这 种 模型 对 
重复 测度 数据 的 应 用 ， 而 第 11 章 描述 了 根据 不 完整 数据 估计 线性 回归 问题 的 
应 用 。 我 们 将 考察 基于 期 望 最 大 化 算法 的 最 大 似 然 估计 以 及 基于 费 会 尔 得 分 的 
最 大 似 然 估计 。 

这 些 多 元 模型 估计 中 的 一 个 基本 问题 是 ， 它 与 两 层 、 三 层 和 交互 分 类 模型 
十 分 相似 ， 有 时 甚至 更 为 简单 。 然 而 ， 可 以 估计 出 许多 有 趣 的 协 方差 结构 ， 而 
且 它 们 在 重复 测量 数据 的 场合 中 具有 特殊 意义 ， 就 像 第 6 章 所 示范 的 那样 。 

下 面 ， 我 们 来 考察 基本 的 多 元 分 层 模型 的 估计 。Jennrich 和 Shluchter 
(1986) 为 这 项 工作 打下 了 基础 。 这 种 方法 可 以 被 扩展 到 两 层 多 元 线性 模型 ， 
比如 其 中 我 们 有 个 人 的 多 种 测度 结果 ， 而 这 些 个 人 又 髓 讲 于 社会 情景 中 ， 诸 如 
学 校 、 社 区 或 公司 等 。Thum (1997) 曾 详细 描述 了 这 种 情况 ， 并 且 我 们 在 第 
8 章 已 经 示范 了 这 种 方法 。 


模型 


在 第 UL 章 ， 我 们 将 一 个 多 元 正 态 模型 描述 为 两 层 分 层 线性 模型 的 一 个 特 
例 。 在 Little 和 Rubin (1987) 看 来 ， 这 种 模型 包括 了 随机 缺失 (MAR) 的 数 
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据 。 层 -1 模型 仅 简单 地 识别 所 观测 的 是 完整 数据 的 那 一 部 分 。 我 们 有 : 


Y, = MY; [14.53] 


| =M, 
其 中 ，Y 代表 n, x1 阶 的 观察 数据 向 量 ，Y” 表 示 7 x1 MEUZER, MiM, 
EÈ n, x 了 了 阶 的 标识 变量 矩阵 。 在 层 ~2， 我们 有 对 于 完整 数据 的 标准 多 元 模型 : 
| Y) = A;B, +0, [14.54] 
| 将 方程 14. 54 RA WE 14.53 后 得 到 : 
Y, = MAS 0, + Mð, 0, ~ N(O,A) [14.55] 


上 面 这 个 方程 可 以 被 看 作 是 一 般 两 层 模型 了 =4,0, +4,0, + e 的 一 个 特例 ， 其 
H Ag=MA;, A,=M,, IR e, =0,0 


因此 最 低 限度 地 ，Y, ~ NC AQ, V), HEP V, =A,AAT. Y, A ORAH 
也 服从 多 元 正太 分布; 


KE "[( —9— pe ” “| [14.56] 


接 下 来 有 条 件 分 布 (9 | ,91,4) ~N(b D; ) ， 其 中 ， 


Dy = A - AAMT(A,BAT) ALA 
j (iiia. aa] * [14.57] 
6; = AAI(A,AAT)“'(Y, - A,6,) 


期 望 最 大 化 算法 


下 面 紧 接着 就 是 期 望 最 大 化 (EM) 算法 的 最 大 化 步骤 。 如 果 8, 被 观测 
到 ， 那 么 最 大 似 然 估 计量 为 : 


å, = (Dan's As) gav CY; ~ 4,0) 
A 
要 
Â = J F 0,0} [14.58] 
get 


© RE, RNA AMKBATRARRDHRER, RAEKTRA 这 个 符号 在 下 面 几 节 中 表示 
更 加 特殊 的 模型 参数 ， 比 如 方程 [4. 65。 
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用 期 望 替代 步 又 来 计算 完整 数据 的 充分 统计 量 (CDSS) 


i 
e| F ALV OY, - A,0,) | ¥,.6 0° | = 


-i +0 
AsV CY; - 4,0;°) 





[14.59] 
i 了 
E( 6,0; | ¥,.7.a°) = 
ep, of 和 A" 是 当前 的 估计 值 。 
费 舍 尔 一 渤 代 一 般 最 小 二 乘法 (IGLS) 算法 
费 舍 尔 得 分 的 迭代 涉及 : 
A(new) - A(old) =- [E(H)] `S [14.60] 
其 中 ， S= ÈS,,E(H) = DEH), 并 且 
. _ L(Y 34,8) 
ja 
2("Sr mee (po O Vi") vee ddt = V) [14.61] 


E(H,) = (= —R ) 


avec( V,) 
ve 
) Ov) 
BE, dj =Y, -Agbo 


利用 上 一 节 中 的 方法 ， 替 换 V 并 将 代数 简化 ， 即 得 : 


ECH,) =- ELCA; 4, @ AV;'AGE, 


$= Fei [aay -sya ] (14.62) 
Jip, E, =dvecA/dg", iti At 是 在 给 定 方程 14. 58 和 14.59 条 件 下 A 的 期 望 
最 大 化 估计 值 。 因 此 ， 我 们 又 一 次 看 到 ， 费 舍 尔 步骤 是 期 望 最 大 化 步骤 的 一 种 
转换 形式 。 


br 的 费 舍 尔 得 分 算法 可 以 得 到 标准 的 一 般 最 小 二 乘 估计 : 


4 ad 
å = (Lava) Dany, 
js j= 
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其 他 协 方 差 结构 的 估计 


正如 第 6 章 中 所 描述 的 ， 在 费 舍 尔 一 迭代 一 般 最 小 二 乘法 的 框架 之 下 ， 可 
以 直接 估计 多 元 分 层 线 性 模型 的 许多 子 模型 。 每 个 子 模型 涉及 在 A 上 强加 一 
个 结构 (Jennrich & Shluchter，1986 ) 。 一 些 有 趣 的 例子 包括 : 


。 层 -1 同 质 性 方差 的 随机 系数 结构 ; 
。 层 -1 异 质 性 方差 的 随机 系数 结构 ; 
© 自 相关 的 层 -1 方差 结构 (ARI). 


为 了 将 费 舍 尔 算法 应 用 于 这 些 研究 ， 每 一 种 场合 都 需要 : 


。 在 这 个 特定 模型 中 设置 协 方差 矩阵 A 中 o 的 特殊 元 素 ， 并 且 
© it FRM E, = gvecAvdp。 


为 了 示范 ,我们 将 说 明 ， 如 何 将 随机 系数 结构 做 多 元 分 层 线性 模型 ( HM- 
LM) 的 特例 来 进行 估计 (只 要 完整 数据 是 平衡 的 ) 。 对 其 他 情况 (如 ARI, 
层 -1 方差 异 质 ) 感 兴趣 的 读者 可 以 查看 网 站 www. ssicentral com 上 对 这 些 模 
型 更 为 详细 的 讨论 。 

HERR, KERRY 是 一 个 增长 研究 中 的 重复 测量 ， 就 如 第 6 章 所 
描述 的 。 更 具体 地 说 ， 研 究 设计 要 求 对 于 每 一 个 参与 者 有 同样 一 套 在 了 个 时 
点 上 的 观测 值 ， 但 数据 Y 是 有 随机 缺失 的 ， 完 整数 据 Y” 是 平衡 的 ， 因 此 ， 
层 -1 有 : 

Y, = MY; 
[14.63] 
Y; = AT +r, 7, ~ N(0,¢°I) 


这 里 ，4 是 层 -1 的 设计 矩阵， 而 且 对 于 所 有 参与 者 都 是 相同 的 。 在 层 -2， 我 
们 有 : 


m, = KB+u, u, ~ N(O,T) 


于 是 ,完整 数据 的 组 合 模 型 为 : 
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Y’ = AXB + Au, +r, [ 14. 64) 
一 种 多 元 模型 (方程 14. 54) 的 特殊 情况 有 : 


6 = 有 


Aj = AX, 
[14.65] 


0, = Au, +r, 
Var(@,) = A = ATA’ + 0°! 
例如 ， 来 自 全 国 青年 调查 (第 6 章 ) 的 数据 中 ， 每 个 人 有 5 个 时 点 上 的 数据 。 
无 约束 的 多 元 分 层 线 性 模型 将 有 一 个 包括 5(5 +1)/2 =15 个 特殊 元 素 (p, 
+, Gis) WA, MEH E, =dvec (A) Zde 将 是 一 个 25 x15 阶 的 矩阵 。 与 此 相 
KR, 一 个 方差 齐 性 的 线性 增长 模型 则 会 有 : 


1 
1 

4=|1 ofj Te [14.66] 
1 
1 


V m 


我 们 得 到 : 
Pı = Too» P: = To， P: = Tis p =o 
Alt, E, 将 是 25 x4 BE. RE, RNA: 


E, = (A@A)E, + vec(/)F [14.67] 


HEP, E, =g vec (T)/dp", HFA F =00'°/d9", 

这 个 两 层 增长 模型 可 以 作为 一 般 的 多 元 分 层 线性 模型 (HMLM) 的 特例 来 
fait. WREATH o 当前 的 估计 值 ， 就 按 方程 14. 65 来 计算 A。 现 将 E, 按 
方程 14. 67 那样 定义 ， 并 应 用 方程 14. 62 的 标准 费 舍 尔 算法 。 


讨论 


如 上 所 述 ， 多 元 分 层 线性 模型 可 以 被 剪裁 ， 以 便于 处 理 不 同 的 协 方差 结 
构 。 设 置 它们 可 以 通过 A， 它 是 向 量 p 中 特殊 元 素 的 函数 。 仍 可 以 应 用 标准 算 
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法 ， 但 是 参数 向 量 o 已 经 被 剪裁 为 所 感 兴趣 的 特定 协 方差 结构 。 偏 导 和 矩阵 
E, = dvec( A) /ap" 也 被 剪裁 为 特定 的 协 方差 结构 ， 更 高 层次 也 如 此 处 理 。 例 
如 ， 要 研究 店 套 于 第 上 组 的 个 人 J 的 完整 数据 7; 的 分 布 ， 组 内 协 方差 矩阵 为 
hxAAn+。 于 是 ， 这 种 估计 问题 就 类 似 于 处 理 一 个 三 层 模型 ， 其 中 层 - 1 方差 被 
设 为 0。 我 们 建议 有 兴趣 的 读者 参阅 Thum 的 研究 (1997) ， 他 也 提供 了 一 系列 
有 趣 的 应 用 ， 或 者 去 网 站 www. ssicentral. com 查阅 进一步 的 讨论 。 

这 种 方法 基于 一 个 关键 假定 ， 即 缺失 数据 是 随机 缺失 的 。 这 就 意味 着 ， 缺 
失 数 据 (T-M) 在 给 定 观测 数据 了 时 是 独立 于 M, 的 。 这 种 假定 通常 是 合 
理 的 。 尽 管 这 种 假定 也 可 能 在 技术 上 不 正确 ， 但 如 果 缺 失信 息 比 例 很 小 ， 其 结 
果 仍然 是 稳健 的 。 当 仅 有 少数 案例 有 数据 缺失 ， 或 者 观测 数据 与 缺失 数据 间 有 
很 强 关 联 时 ， 缺 失信 息 比 例 便 会 很 小 。Schafer (1997) 就 这 一 假定 做 过 全 面 的 
综述 和 讨论 。 


分 层 一 般 化 线性 模型 的 估计 


正如 本 章 一 开始 所 述 ， 对 分 层 模 型 进行 最 大 似 然 估 计 涉 及 两 个 步骤 ( 见 
“最 大 似 然 估 计 和 贝 叶 斯 估计 的 综述 ”部 分 )。 第 一 步 是 找到 似 然 值 ， 它 要 求 
从 数据 和 随机 效应 的 联合 分 布 中 对 随机 效应 进行 积分 (方程 14.1); 第 二 步 是 
使 似 然 值 最 大 化 。 当 模型 是 线性 的 且 每 一 层 的 随机 效应 都 服从 正 态 分 布 时 ， 第 
一 步 就 比较 简单 。 唯 一 比较 困难 的 问题 就 是 最 大 化 问题 。 

我 们 现在 来 考虑 更 为 复杂 的 估计 问题 ， 即 : 层 - 1 模型 是 非 线性 的 ， 
层 -1 随机 效应 的 分 布 也 不 是 正 态 分 布 。 这 种 模型 的 实际 例证 已 经 在 第 10 章 描 
述 过 。 非 线性 、 非 正 态 分 布 的 层 - 1 模型 的 例子 包括 : 二 分 类 结果 的 logit 连 
接 、 计 数 数据 的 对 数 连接 、 序 次 结果 的 累计 logit 连接 以 及 多 分 类 名 义 结果 的 
多 类 logit 连接 。 在 这 些 情 况 下 ， 尽 管 在 其 他 层次 上 假定 随机 效应 服从 多 元 正 
态 分 布 ， 层 - 1 的 抽样 模型 却 是 非 正 态 的 。 

按照 方程 14.1 中 所 介绍 的 一 般 标注 方式 ， 我 们 有 一 个 数据 向 量 Y、 一 个 
随机 效应 向 量 u 和 一 个 参数 向 量 w。 这 些 参 数 包 括 方差 协 方差 分 量 和 固定 的 回 
归 系数 。 当 给 定 随机 效应 即 层 - 1 模型 时 ， 数 据 的 分 布 被 表示 为 (Y |u, w), 
而 随机 效应 的 分 布 被 表示 为 p(wu jw) 。 数 据 与 随机 效应 的 联合 分 布 就 是 ， 


a(Y,u|w) = f(Y | u,w)p(u | w) [ 14. 68) 
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参数 w 就 是 Y 的 边际 密度 ， 数 据 的 似 然 值 便 是 这 一 联合 分 布 在 随机 效应 空间 
上 的 积分 : 


LY |w) = fa Y | u,w)p(u | w)du [14.69] 


4A Y|u, w) 和 plu|w) 都 是 正 态 分 布 时 ， 边 际 的 L(Y|w) 也 是 正 态 分 布 
的 ， 而 且 也 可 以 求 导 。 计 算 上 的 问题 就 是 寻求 一 套 中 使 Z(Y|w) 最 大 化 。 

现在 我 们 所 面临 的 问题 是 ，f(Y|uw，w) 可 能 是 二 项 分 布 ， 或 是 泊 松 分 布 ， 
或 是 多 类 分 布 ， 但 不 是 正 态 分 布 。 在 这 种 情况 下 ， 我 们 可 以 将 p(u | wo) 作为 
随机 效应 的 共 辐 先 验 ， 然 后 方程 14. 69 的 积分 就 可 以 通过 分 析 得 到 。 例 如 ， 如 
果 f 是 二 项 分 布 ， 那么 p 就 可 能 是 贝塔 (beta) 分 布 ; 如 果 上 是 泊 松 分 布 ， 那 
4 p REMS (gamma) 分 布 ; 如 果 / 是 多 类 分 布 ， 那么 p 就 可 能 是 狄 利克 雷 
(Dirichlet) 分 布 。 然 后 我 们 就 可 以 迅速 转移 到 在 “ 双 正 态 ” (normal-normal) 
分 布 的 情况 下 如 何 得 到 最 大 化 的 问题 了 。 

这 种 方法 的 困难 在 于 ， 由 于 我 们 通常 感 兴趣 的 是 多 元 随机 效应 ， 尽 管 当 每 
一 更 高 层次 上 仅 有 一 个 随机 效应 时 ， 共 辐 先 验 的 做 法 便 很 方便 ,但 这 些 非 正 态 
先 验 并 不 一 定 能 代表 多 元 随机 效应 的 联合 分 布 。 由 于 它 可 以 被 用 作 多 元 分 布 的 
一 个 模型 ， 因 此 我 们 就 先 借助 多 元 正 态 分 布 作为 先 验 分 布 。 

因此 ,我 们 又 过 到 了 联合 分 布 的 非 共 纯 混 杂 问 题 ， 比 如 “二 项 一 下 态 ”、 
“ 泊 松 一 正 态 ”"， 以 及 “多 类 一 正 态 ” 等 混合 情况 。 在 这 种 情况 下 ， 不 存在 求 
似 然 值 积分 (方程 14.69) 的 闭 型 公式 ， 我 们 必须 转 而 以 数值 逼近 方法 来 解决 
这 个 积分 问题 。 当 然 ， 此 后 还 得 解决 最 大 化 问题 。 

我 们 先 提供 有 关 数 值 积 分 方法 的 简单 综述 。 接 下 来 ， 我 们 将 介绍 拉 普 拉 斯 
算法 。 这 个 方法 有 助 于 澄清 积分 问题 的 本 质 ， 同 时 对 于 有 任意 维度 多 元 随机 效 
应 的 分 层 模 型 而 言 ， 它 也 提供 了 一 个 一 般 性 的 并 且 是 可 行 的 数值 计算 策略 。 我 
们 先 描述 如 何 将 这 种 方法 应 用 于 二 分 类 数据 的 情况 ， 然 后 再 将 它 推广 到 其 他 各 
类 模型 。 


分 层 模 型 的 数值 积分 


Stiratelli, Laird 和 Ware (1984) 曾 估 计 了 吝 套 的 、 具 有 正 态 分 布 随机 效应 
的 logistic 回归 的 参数 ， 他 们 按 有 相同 众 数 和 众 数 曲率 的 多 元 正 态 分 布 作为 真 
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实 后 验 来 近似 计算 密度 u| Y, w, Wong 和 Mason (1985) 也 曾 用 过 本 质 上 相 
同 的 方法 。 对 这 种 近似 联合 分 布 的 直接 最 大 化 避免 了 对 方程 14. 69 求 积分 的 困 
HE, Lee 和 Nelder (1996) 将 方程 14.6 被 积 函数 看 成 一 个 “hh 似 然 值 ” 
(h-likelihood) ， 并 讨论 了 基于 对 其 直接 最 大 化 所 估计 的 u 和 w 的 性 质 。 

- 些 作者 还 将 这 种 方法 在 其 他 方面 做 了 扩展 ， 例 如 Belin、Diffendal、 
Mack, Rubin, 、Schafer， 以 及 Zazlavsky (1993), Breslow 和 Clayton (1993), 
Gilks (1987), Goldstein (1991), Longford (1993), McGilchrist ( 1994), 
Schall (1991), ， 还 有 Wolfinger (1993), #4 Breslow 和 Clayton (1993), ff] 
将 这 种 方法 称 为 惩罚 性 准 似 然 (PQL) 方法 。 然 而 ，Breslov 和 Lin (1995) 已 
经 证 明 ， 对 于 带 有 嵌 套 随机 效应 的 logistic 回归 模型 ， 对 正 态 协 方差 矩阵 以 及 
由 此 而 得 到 的 回归 系数 的 PQL 估计 是 有 偏 的 ， 而 且 也 不 具 一 致 性 ( 另 见 
Goldstein & Rasbash，1996) 。 当 随机 效应 具有 较 大 方差 并 且 二 项 分 布 的 分 母 较 
小 时 ， 偏 差 就 会 非常 严重 。 


应 用 于 二 分 类 结果 的 两 层 模型 


假设 现在 层 -1 结果 Y, 取 值 为 1 的 条 件 概率 为 p;,， 则 对 嵌 套 于 层 -2 单位 
了 中 的 层 -1 单位 i 的 组 合 模型 为 ; 





iog( * = n; = Xiy + Ziu, (14. 70] 


在 层 - 1, RARE, HE u 为 0 x 1 阶 随机 效应 向 量 ， 并 且 向 量 wu 在 所 
有 层 - 2 单位 服从 8 元 的 N(0，7)， 那 么 Y 依 此 条 件 服从 贝 努 里 Bernoulli) 
分 布 。 在 许多 情况 下 ， 由 于 这 个 模型 可 以 省 赂 下 标 i 因而 很 方便 使 用 : 


n; = X,y + Zu, [14.71] 


HF, n 是 由 元 素 1 ARRAY n x1 阶 向 量 ， TX, MZ, BAM, RA 
由 ASM 27 组 成 ， 阶 数 分 别 为 n, xf An, x Qo 


透 罚 性 准 似 然 估计 


惩罚 性 准 似 然 (PQL) 方法 可 以 作为 非 线性 回归 模型 来 推导 (Seber & 
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Wild，1989) 。 在 二 分 类 结果 和 logit 连接 时 ， 我 们 先 从 层 - 1 模型 开始 : 
Y, = @, +e, 
E(e,) =0 (14. 72] 
Var(e,) = guil - ¢,) 
这 是 一 个 非 线 性 模型 ， 但 我 们 用 一 阶 泰勒 展开 式 将 它 线 性 化 。 在 第 s BER 
时 ， 我 们 有 : 


in, We o 
Pi = Pi tin WTW) [14.73] 
在 w' "点 求 导数 : 
de 
an, = 9,(1-9,) =w; [ 14.74} 


将 w 的 线性 近似 值 代 入 方程 14.72， 得 到 : 


Y, = p” + wy (ny - ni) +e, [14.75] 


整理 这 一 方程 ， 将 所 有 已 知 量 都 移 到 方程 左边 ， 得 到 : 


ragù 
FL + ah? = ny +t [14.76] 
4 wg 


这 个 方程 便 具有 类 似 于 两 层 分 层 线性 模型 的 形式 ; 


y= xiy + Zu, Pep e; ~ N(O,w,""') 





[14.77] 
u, ~ N(0,T) 
其 中 : 
Ye - 9 
Y; > 2 at +7.” 
w, 
haa [14.78] 
e 


7, ”的 估计 值 为 ; 


ni" 2 xy + ZTu [14.79] 
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其 中 心 | E4 W” = diag ja …， wy? | 时 近似 的 后 验 众 数 : 
本 (2 [14.80] 


惩罚 性 准 似 然 算 法 可 以 根据 下 面 的 步骤 来 做 : 

1. 将 方程 14. 77 看 成 标准 的 分 层 线 性 模型 ， 根 据 和 wy 的 初始 估计 值 ， 
利用 期 望 最 大 化 (EM) 或 费 舍 尔 得 分 方法 ， 考 虑 层 -2 的 方差 协 方差 分 其 了 
和 固定 效应 yY， 以 使 似 然 值 最 大 ， 

2. 根据 新 的 估计 值 y* AT, 计算 新 的 权重 ws 
(1 -gs'”)。 同 时 也 计算 线性 化 以 后 的 因 变量 Y 的 新 值 。 

3. 回 到 第 一 步 。 继 续 和 迭代 直至 参数 估计 值 收 伍 于 预 完 设 定 的 某 一 容 
UE. 

这 种 算法 将 线性 化 的 因 变 量 (方程 14.77 和 14.78) 看 成 近似 的 正 态 分 
布 ， 在 这 种 情况 下 ， 方 程 14. 69 的 积分 具有 闭 型 。 只 要 层 - 2 方差 不 是 太 大 ， 
这 时 方差 估计 和 固定 效应 估计 为 负 偏差 ， 算 法 将 可 靠 地 收 剑 ， 并 得 到 合理 的 估 
计 值 (参见 Breslow & Lin，1995 ) 。 下 一 节 将 要 讨论 的 是 ，PQL 算法 可 以 为 更 
准确 的 拉 普 拉 斯 近似 算法 提供 很 好 的 初 值 。 

边际 准 似 然 (marginal quasi-likelihood, MQL) 算法 与 PQL 算法 基本 相同 ， 
只 是 在 利用 泰勒 级 数 展开 时 是 围绕 着 u, =0， 而 不 是 围绕 着 近似 后 验 众 数 
u,=u;"’ (Breslow & Clayton，1993) 。 权 数 和 线性 化 的 因 变 量 可 以 根据 下 式 来 
He: 


Gen 
p 


n” = Xiy [14.81] 


MQL 估计 比 PQL 估计 和 值 的 偏差 更 严重 (Breslow & Clayton, 1993; Breslow & 
Lin, 1995; Rodriguez & Goldman，1995 ) 。 我 们 还 发 现 ， 这 些 MQL 估计 在 收敛 


上 的 可 车 性 比 PQL 估计 要 差 。 
最 大 似 然 估计 的 更 精确 近似 


另 一 种 求 出 一 致 性 的 渐 近 无 偏 的 最 大 似 然 估计 近似 值 的 方法 是 ， 先 对 方程 
14. 69 按 要 求 的 精度 求 出 积分 近似 值 ， 然 后 再 使 这 个 近似 积分 值 最 大 化 。An- 
derson 和 Aitkin (1985) 曾 对 每 组 观测 值 只 有 一 个 随机 效应 的 logistic 回归 模 
型 ， 应 用 高 斯 - 赫 米 特 积分 法 (Gauss-Hermite quadrature) 来 求 似 然 值 并 使 其 
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最 大 化 。Hedeker 和 Gibbons (1994, 1996) 也 应 用 高 斯 - 赫 米 特 积分 法 来 求 具 
有 多 元 正 态 先 验 的 序 次 probit 和 logistic 模型 的 积分 。 还 可 以 参阅 Tsutakawa 
(1985) 对 泊 松 一 正 态 混合 分 布 的 研究 情况 。 

Pinheiro 和 Bates (1995) 曾 运用 适应 性 的 高 斯 - 赫 米 特 积分 法 ， 对 一 个 具 
有 正 态 分 布 数据 和 非 线 性 连接 的 嵌 套 随机 效应 模型 的 最 大 似 然 值 做 近似 值 估 
计 。 利 用 这 种 适应 性 方法 ， 积 分 中 的 变量 ( 即 随机 效应 u) 按 其 近似 后 验 众 数 
对 中 ， 而 不 是 按 其 均值 0 对 中 。 从 原理 上 讲 ， 使 用 这 种 方法 比 使 用 非 适应 性 方 
法 得 到 的 结果 更 加 准确 ,特别 是 当 随 机 效应 离散 度 较 大 时 。Chan (1994), 
Karim (1991) ， 以 及 Wei 和 Tanner (1990) 曾 运用 蒙特 卡 罗 积 分 来 求 类 似 于 
方程 14. 69 中 的 积分 值 。 当 每 一 层 中 相关 随机 效应 的 数量 增加 时 ， 用 高 斯 积分 
公式 进行 数值 积分 就 变 得 越 来 越 困 难 ， 而 蒙特 卡 罗 积 分 的 计算 量 很 大 ， 并 且 得 
到 的 是 随机 收敛 ， 而 不 是 数值 收敛 。 随 机 收敛 很 难 评估 。 

另 一 种 计算 积分 近似 值 的 方法 是 采用 拉 普 拉 斯 方法 。Breslow 和 Lin 
(1995) 利用 4 阶 拉 普 拉 斯 近似 来 矫正 偏差 ， 这 种 偏差 是 POL 方法 应 用 于 每 组 
只 有 一 个 随机 效应 的 堪 套 随机 效应 模型 时 产生 的 。Lin 和 Breslow (1996) 将 这 
种 偏差 矫正 方法 扩展 到 每 组 有 多 个 独立 的 随机 效应 的 情况 。Raudenbush、Yang 
和 Yosef (2000) 将 这 种 逻辑 扩展 到 更 高 阶 的 近似 计算 ， 以 及 每 组 有 多 个 相关 
的 随机 效应 的 情况 。 他 们 并 不 是 用 这 种 方法 来 矫正 偏差 ， 而 是 将 积分 的 近似 值 
看 成 似 然 值 ， 并 使 其 最 大 化 以 推断 。 这 种 方法 有 以 下 优点 : (1) 每 一 组 的 积分 
都 完全 是 任意 维度 、 多 元 的 ; (2) 近似 值 的 准确 度 可 以 达到 任意 要 求 ; (3) 收 
伍 性 是 数值 的 ， 而 不 是 随机 的 ; (4) 计算 过 程 非常 迅速 。 


将 积分 表示 为 拉 普 拉 斯 转换 


如 果 我 们 将 方程 14. 69 的 积分 公式 用 拉 普 拉 斯 方法 改写 的 话 ， 数 值 积分 问 
题 就 变 得 更 清楚 了 。 由 于 积分 是 一 组 一 组 地 进行 的 ， 我 们 需要 考虑 一 个 一 般 类 
属 ， 为 了 表达 简洁 ， 不 再 标注 下 标 ) 首先 ， 我 们 将 被 积 函数 改写 为 自然 对 数 
ÉR: 


h(u) = log f(¥ |u,w)] + log[p(u | w)] [14.82] 


接 下 来 ,假设 h(u) 及 其 关于 uw 的 所 有 导数 都 在 其 邻 点 4 上 是 连续 的 ， 我 
们 就 可 以 将 hu) 扩展 为 关于 估计 值 x 上 的 泰勒 级 数 : 
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hlu) = h(n) +h (ù)(u - u) 


tuua) DT [14.83] 


RE, Ahlu) 是 h(w) 在 点 4 求 的 第 m 次 导数 ,而 7, 是 泰勒 级 数 的 第 上 项 。 
我 们 选择 4 作为 h(u) 的 最 大 值 的 对 应 点 ， 因 此 h'"(u) =0， 要 求 的 积 
分 (方程 14. 69) RBA: 


L(Y | uyw) = exp[h(u)] exp{ (uw ~u) [A (ù) | Cu - ù) exp[ A Tlu 
= |y | exp[h(i) Eson [exp © 7,)] [14.84] 
kal 


这 里 ，&wio wm 表 示 一 个 按 正 态 密 度 所 取 的 期 望 值 ， 这 一 正 态 分 布 的 均值 为 0， 
方差 为 : 


Ve-[h?(a)j" { 14.85] 


如 果 h(u) 是 一 个 二 次 函数 ， 那 么 高 于 二 次 的 所 有 导数 均 为 0， 因 此 exp (ET) 
=1， 而 方程 14. 84 中 的 积分 函数 也 将 是 联合 正 态 密度 。 这 就 是 在 前 面 的 分 层 
线性 模型 中 考虑 到 的 有 关 积 分 问题 的 形式 。 

如 果 h(u) 是 近似 二 次 项 ， 这 就 意味 着 展开 项 T, 及 更 高 次 都 是 可 以 忽 
略 的 ， 那 么 具有 exp( ET) =1 的 方程 14. 85 的 最 大 化 是 近似 正 态 的 ， 称 为 
“WRH” RERE, Hin, R/O |u, w) 是 二 项 分 布 ， 但 它 建立 在 
大 量 测试 的 基础 上 。 众 所 周知 ， 二 项 分 布 随 着 测试 数量 的 扩大 而 收敛 于 正 态 
分 布 。 由 此 可 知 ， 由 于 f(Y1u，w) 近似 于 正 态 密度 ,p(wu jw) 是 正 态 的 ， 
h(u) 是 近似 二 次 项 ， 那 么 常规 拉 普 拉 斯 近似 值 也 将 是 准确 的 。 我 们 将 把 常 
规 拉 普 拉 斯 近似 标注 成 L, ， 即 二 阶 拉 普 拉 斯 近似 ， 因 为 它 基于 h(u) 为 近似 
二 次 项 的 假定 。 

然而 ,如 果 f(Y|uw，w) 并 不 是 近似 正 态 的 ， 那 么 h(u) 也 不 可 能 是 近似 
二 次 项 ， 而 矫正 项 exp( E7) 与 1 之 间 将 有 很 大 差距 。 因 此 ， 我 们 可 以 写 出 K 
阶 的 拉 普 拉 斯 近似 公式 : 


by = b x Eun [eC ST) [14.86] 


iz S, =EN, 再 定义 第 二 个 级 数 为 exp(Sxw) =1 +S, +52/2! += +S#/M!, 
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其 中 我 们 将 指数 函数 表示 成 4 阶 的 马克 劳 林 级 数 。 于 是 ， RIA: 
Ly = by x Eggs (1 +S, +S2+…+SLAMT) [14. 87) 


这 使 我 们 得 到 了 一 族 随 着 KK AM 的 增加 而 准确 性 不 断 增 加 的 近似 值 。 

Raudenbush Yang 和 Yosef (2000) 描述 了 将 这 种 方法 应 用 于 对 更 多 类 型 
的 层 ~1 模型 的 近似 计算 ， 即 对 “一 般 化 线性 模型 ”的 计算 (McCullagh & 
Neider，1989) 。 他 们 还 说 明了 ， 如 何 对 任意 维度 的 随机 效应 推导 似 然 值 的 近 
似 值 ， 并 示范 了 它 在 二 分 类 结果 的 两 层 模型 情况 下 的 计算 速度 和 准确 性 。 对 计 
算 细 节 感 兴趣 的 读者 可 以 参考 这 篇 论文 ， 下 面 我 们 将 示范 如 何 将 这 种 方法 应 用 
于 二 分 类 结果 模型 。 


拉 普 拉 斯 方法 应 用 于 两 层 的 二 分 类 数据 
层 -1 模型 。 这 里 为 了 简化 ， 我 们 将 下 标 / 去 掉 。 在 二 分 类 的 情况 下 ( 方 
程 14.70 和 14.71)， 在 层 -1 中 我 们 有 : 
KY |uw) = Teva -9.)' [14. 88) 
因此 ， 
log[/(Y |u.w)] = Ku) = Yin, + log(1 - g.)] [14.89] 
层 -2 模型 。 在 数据 是 正 态 分 布 的 条 件 下 ， 随 机 效应 u 的 密度 可 以 写成 ， 
plu |w) = (27) 2 | 7] exp- ul T'u/2) [14.90] 


组 合 模型 。 组 合 层 - 1 模型 和 层 -2 模型 ， 就 得 到 联合 分 布 p(Y,u | w) = 
(27) P] T| explh(u)], Hp; 
hiu) = Mau) = u'T'u/2 [14.91] 
使 h(u) 最 大 化 。 拉 普 拉 斯 转换 要 求 h(u) 关于 w 最 大 化 。 令 一 阶 导数 等 
于 0 便 得 到 0 个 方程 ; 


hu) =U (Cu) -Tu 
=2Z(Y-p)-T'u=0- 


[14.92] 
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设 多 为 一 个 对 角 和 卸 阵 ， 其 元 素 为 dp,/dm =w, =9,(1- 9). X McCullagh 和 
Nelder (1989) 公式 中 线性 化 的 因 变 量 为 : 


yo = W'(¥-~) +n [14.93 
HWY’ - 9) 代替 方程 14.92 中 的 (Y-—), BOM: 
Z'W(Y' ~ Xy) = (Z'WZ + Tu [14.94] 
这 个 等 式 已 经 可 以 用 牛顿 - 拉夫 和 森 算法 求解 了 。 我 们 需要 二 次 导数 的 矩阵 : 
he = -(Z2'WZ+T"') [14.95 
牛顿 -拉夫 森 算 法 在 第 s + 1 次 迭代 时 计算 出 : 


te 二 O [AP (ult) ] “HEY CGH) 
= (Z WOZ rT’ z wee -= Xy) 





[14.96] 


总 之 ， 对 于 未 知 参数 w 的 任何 值 ， 我 们 都 可 以 用 牛顿 - 拉夫 森 迭 代 算法 ， 
找到 一 个 4 使 h(u) 最 大 。 这 个 使 h(u) 最 大 的 点 就 会 成 为 泰勒 级 数 的 固定 
中 心 点 ， 它 将 拉 普 拉 斯 近似 值 定义 为 对 数 似 然 值 ， 即 各 组 对 数 似 然 值 之 和 。 然 
后 我 们 利用 费 会 尔 得 分 方法 使 这 个 对 数 似 然 值 关 于 w 最 大 。 有 关 计 算 的 具体 
介绍 请 参阅 Raudenbush 等 人 (2000) 的 论文 。 

评论 。 方 程 14. 96 所 定义 的 牛顿 - 拉夫 森 算法 的 步骤 有 一 个 非常 有 趣 的 形 
式 : u"'“ "与 两 层 模型 中 随机 效应 的 后 验 均 值 估计 或 “经 验 贝 叶 斯 残 差 ”估计 
是 相同 的 ， 其 中 这 个 模型 中 的 结果 变量 Y" 是 连续 的 ， 而 且 层 - 1 的 协 方差 矩 
阵 就 是 WW“。 这 是 可 以 理解 的 。 如 果 h(u) 是 二 次 项 ， 那 么 (wu | Y, w) 就 是 
ESH, HAERE YI u HRA o 将 等 于 这 个 均值 。 这 种 正 态 理论 的 分 
层 线性 模型 和 非 正 态 的 分 层 一 般 化 线性 模型 之 间 的 关系 ， 对 于 更 简单 地 近似 计 
算 最 大 似 然 值 非常 重要 ， 当 然 也 包括 惩罚 性 准 似 然 方法 (POL, HB 
14. 80) 。 


向 其 他 层 -1 模型 推广 


我 们 已 经 示范 了 在 二 分 类 数据 的 情况 下 近似 计算 最 大 似 然 估计 和 准 似 然 佑 
计 的 方法 ， 事 实 上 这 些 方法 都 可 以 扩展 到 更 为 广泛 的 层 -1 模型 ， 即 指数 族 模 
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型 上 ， 其 中 包括 了 正 态 分 布 的 特殊 情况 、 二 项 分 布 、 泊 松 分 布 、 爷 玛 分 布 等 
等 。 当 推广 到 包括 指数 族 时 ， 我 们 的 层 -1 模型 就 变 为 ; 


KY, | uj) = exp(l,) 


而 


L= Sn, -8(ps))/a(0) + y(¥,.8) | 


其 中 a、5、y 是 它们 自 变量 的 任意 函数 ， 而 5(Y) =u 注意 ， 这 里 隐 含 着 
jy 各 ms 是 随机 效应 u, 的 函数 。 

为 了 得 到 边际 似 然 值 ， 我 们 希望 从 联合 密度 7 Au, j=1，2，…，J， 对 
u, 进行 积分 : 


La JI Y, |u,.y)p(u, | T)du, 


J 
-JĮ ! [T]? fexp(s, -ju Tu) du, [14.97] 


MD (27) 


WT OAR MEO ARATE LJ! Tu, 看 成 方程 14.83 H hlu), 


HiPus (uy. 0, u,)", MAA hU) 最 大 值 的 对 应 点 二 (y，r) ， 寻 求 直 
到 6 阶 的 导数 : 


LAG) — 


2h” (a) =20 aT, Heep 
g” 4 og ON HZ 000) = (YF -mn) WZ/a(0) 

RE, Y =W'(Y,-p,) +n, 是 线性 化 的 因 变 量 (McCullagh & Nelder, 
1989) ; W, 是 由 组 成 的 对 角 和 矩阵 diag( w, ) ， 其 中 元 素 w, = du,/dy,, BD pv 在 
uy EF ,的 导数 。 

B.A) u) =P -7T 其 中 名 = 一 2 了 V2,/a(9)， 即 1 在 点 如 上 的 二 阶 
FR. 

4. UF kS3 (MI GRU LM), h” (a) =)” By, eu, AEAF n h 
第 阶 导 数 。 在 二 分 类 变量 区 用 logit 连接 的 情况 下 ， wy =n,(1-p,) 及 其 第 
3 ~6 阶 的 导数 分 别 是 : 
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mi =w -2p), mi = wC ~ 6w,) [14.98] 
mo = m1) m = mi" (12) - 12m)" 


在 计数 数据 (Y,e i0、1，…|) 是 从 一 个 条 件 泊 松 分 布 中 抽取 并 采用 对 数 连 
eat, MPLA, BA w, = mW”=jps。 当 是 一 个 用 倒数 reciprocal) 连 
EON EES HRT. Ae, = pi Al mS = (kk -1)! js。 在 正常 情况 下 ， 有 
w=] ,并且 当 上 >2 时， 有 ms”=0。 众 所 周知 ， 在 二 项 分 布 和 泊 松 分 布 的 情 
况 下 有 常数 项 a(9) 等 于 1， 对 于 正 态 分 布 来 说 有 varl ¥,|u,) =o*， 而 对 于 人 
玛 分 布 来 说 则 为 -1/v， 其 中 方差 为 var( 了 ; | uw) =j;/v。 所 有 4 的 导数 都 是 在 
u, ERIEK TR 


总 结 与 结论 


总 而 言 之 ， 分 层 模型 的 似 然 值 是 一 个 积分 。 如 果 分 层 模型 中 每 一 层 都 是 线 
性 的 ， 且 随机 效应 服从 正 态 分 布 ， 这 个 积分 通过 分 析 就 可 以 简单 地 求 出 。 剩 下 
的 问题 是 如 何 使 似 然 值 最 大 化 。 我 们 已 经 说 明了 在 两 层 模型 中 如 何 运 用 期 望 最 
大 化 算法 和 费 含 尔 得 分 方法 来 完成 这 一 工作 。 然 而 ， 当 层 - 1 连接 函数 是 非 线 
性 的 并 且 层 -1 模型 不 是 正 态 分 布 时 ， 所 要 求解 的 积分 就 只 能 近似 计算 。 

一 个 简单 的 近似 计算 方法 就 是 “惩罚 性 准 似 然 方 法 ”， 它 建构 了 层 - 1 模 
型 中 的 一 个 线性 近似 值 ， 并 假定 “线性 化 的 因 变 量 ” 是 近似 正 态 分 布 的 ， 并 
将 它 扩 展 到 分 层 线性 模型 的 其 他 情况 。 这 种 方法 可 以 可 靠 地 收 贫 ， 但 如 果 高 层 
方差 分 世 很 大 ， 得 到 的 估计 使 可 能 产生 严重 偏差 。 如 果 要 得 到 更 为 准确 的 近似 
估计 ， 就 需要 采用 计算 量 更 大 的 方法 。 它 们 包括 高 斯 - 赫 米 特 积分 法 、 蒙 特 卡 
罗 积 分 ， 以 及 高 阶 拉 普 拉 斯 近似 法 。 

需要 注意 的 是 ， 所 关注 的 积分 是 一 个 无 限 阶 次 的 拉 普 拉 斯 近似 。 这 一 视角 
提供 了 一 族 近 似 方法 ， 并 且 明 确 地 定义 了 每 种 近似 计算 的 误差 。Raudenbush 
等 人 (2000) 发 现 ， 常规 拉 普 拉 斯 近似 计算 存在 关于 阶 次 的 误差 0(n“)， 其 
Pn 是 每 个 层 -2 单位 中 的 层 -1 单位 数 。 通 常 ，n 必须 足够 大 ， 才 能 恰当 地 
估计 随机 斜率 和 截 距 。 拉 普 拉 斯 近似 法 在 这 种 情况 下 效果 很 好 ， 因 为 它 比较 准 
确 ， 而 且 也 允许 随机 效应 有 任意 维度 。 然 而 ， 对 于 随机 截 距 模型 而 言 ，n 可 能 
比较 小 ， 那 么 采用 适应 性 的 高 斯 - 赫 米 特 积分 法 便 会 更 加 准确 ( Yosef, 
2001). 
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层 -1 随机 效应 ， 假 定 条 件 , 249 ~ 253 
层 -1 自 变量 (x) 
多 元 自 变量 , 28 ~ 30 
选择 定位 , 31 ~33 
层 -1 自 变量 ， 含 测量 误差 ,249 
层 -2 的 最 小 二 乘法 残 差 ,65 
PR -2 随机 效应 ， 假 定 条 件 , 259 ~ 260 
层 ~2 自 变量 (W) 
多 元 自 变量 , 28 ~30 
选择 定位 , 33 ~ 34 
层 际 互动 ， 组 织 效应 , 149 
层 际 效 应 的 建 模 , 7 ~9 
估计 精度 误差 ，4 
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差别 效应 , 8 

常规 的 教师 层次 分 析 ， 比 较 学 校 层次 的 分 
$f. 102 ~ 105 

常规 的 学 生 和 班级 层次 的 分 析 ， 比 较 ， 
108 ~ 112 

常规 最 小 二 乘法 (OLS)， 层 - 1 系数 ， 某 
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特定 单位 的 估计 ,83 ~ 84 
常规 最 小 二 乘法 佑 计量 ,64 
惩罚 性 准 似 然 方 法 (POL), 434 
抽样 模型 ， 定 义 , 315 


D 


大 样本 理论 , 266 ~ 270 
单 参数 检验 , 57, 60, 62, 65 
单 因素 协 方差 分 析 (ANCOVA), 24, 28, 36 
单 因素 方差 分 析 , 67 
单元 间 模 型 (JZ -2)， 交 互 分 类 的 随机 效 
应 , 355 ~356 
点 估计 
员 叶 斯 方法 , 381 ~ 382 
贝 叶 斯 推断 , 378 ~ 379 
单 因素 方差 分 析 , 38 ~39, 45 ~46 
更 一 般 的 模型 ,41 ~ 43 
以 均值 作为 结果 的 回归 , 40, 47 ~ 48 
选 代 一 般 最 小 二 乘法 (IGLS) , 429 
对 正 态 均值 的 推断 , 379 ~ 384 
贝 时 斯 方法 ,380 ~ 383 
经 典 方法 , 379 ~ 380 
推广 与 推断 上 的 考虑 ,383 ~ 384 
对 中 , 30 -34 
多 参数 检验 , 57 ~60, 62, 63, 65 
层 -1 系数 检验 , 61 ~63 
多 层 线性 模型 , 5 
多 项 式 ， 高 次 ,其 他 增长 参数 的 定义 ,172 
多 元 方差 已 知 的 模型 ， 元 分 析 , 212 ~ 213 
多 元 模型 ,11 
多 元 重复 测量 模型 (MRM)，176 ~ 177 
多 属性 的 分 项 反应 模型 ,348 ~ 350 
EX, 352 


儿童 层次 的 模型 ,218 
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二 次 增长 模型 .个 体 变 化 , 160 ~ 165 
| F 
反应 偏差 . 337 
KAWEA, MB - 1 随机 效应 ，249 ~252 
THETA AT REE, 358 ~ 359 
交互 分 类 的 随机 效应 ,358 
方差 分 量 ， 推断, 269 ~ 270 
方差 分 析 , 15 
带 随机 效应 的 单 因 素 模型 ，22 
点 估计 , 45 ~ 46 
教师 效率 上 的 学 校 效 应 , 100 ~ 101 
社会 分 布 , 113 
示范 , 83 ~87 
非 随机 变化 的 斜率 寞 型, 27，29, 35 
非 线性 分 项 选择 模型 ，345 ~ 351 
费 会 尔 得 分 , 421 
用 其 做 最 大 似 然 估计 ，13 
多 元 分 层 线 性 模型 ( HMLM ) 
最 大 似 然 估计 ,430 ~ 437 
分 层 数据 结构 
分 层 数据 分 析 中 持续 的 两 难 问题 ，4 
分 层 线性 模型 (HLM), 277 ~ 316 
层 际 效应 模型 ,9 
单 层 的 , 243 ~ 245 
建 模 的 经 验方 法 , 243 ~245 
设置 问题 , 245 ~ 249 
二 分 类 结果 的 两 层 和 三 层 模型 ,280 ~ 295 
贝 努 里 分 布 的 例子 , 282 ~ 287 
层 -1 抽样 模型 ,280 ~ 281 
层 -1 结构 模型 , 281 ~ 282 
层 -1 连接 函数 ，281 
层 -2 和 层 -3 模 型 , 282 
-项 分 布 的 例子 ，290 ~ 295 
分 层 一 般 化 线性 模型 (HGLM) 的 特殊 


情况 , 315 
分 解 方差 协 方差 成 分 , 9 
个 体 效应 的 改进 估计 , 6 
估计 与 假设 检验 的 原理 , 37 ~ 63 
基本 的 两 层 模型 
分 层 形式 , 34 
扩展 形式 , 30 
组 合 形式 , 34 
最 大 似 然 估计 , 417 
两 层 模型 , 253 ~ 266 
层 -1 抽样 模型 , 315 ~316 
层 -1 结构 模型 , 280 
层 -1 连接 函数 , 316 
关键 假定 , 241 ~ 243 
建 模 的 经 验方 法 , 254 ~256 
设置 问题 , 256 ~259 
评估 恰当 人 性, 241 ~271 
统计 理论 , 5 ~6 
推广 , 28 ~30 
完全 无 条 件 的 , 23 
新 发 展 , 9 ~ 13 
一 般 及 其 较 简 单 的 例子 , 22 ~28 
用 于 潜在 变量 , 332 -345 
用 于 缺失 数据 问题 , 320 ~ 327 
用 于 预测 未 来 状况 ,191 ~ 193 
原理 , 15-30 
早期 应 用 , 6 ~9 
分 层 一 般 化 线性 模型 ,278 
定义 ,315 
分 析 多 项 数据 , 308 ~ 315 
层 -1 抽样 模型 , 309 
E -1 结构 模型 , 310 
层 -1 连接 函数 , 309 
层 -2 模型 , 310 
分 析 计 数 数据 , 295 ~ 301 


层 -1 抽样 方法 , 295 
层 - 1 结构 模型 , 296 
层 -1 连接 函数 , 295 
层 -2 模型 , 296 
例子 , 296 ~301 
分 析 序 次 数据 ,301 ~ 308 
惩罚 性 准 似 然 估计 ，434 
单 层 的 累积 概率 模型 ,302 ~ 304 
二 分 类 结果 的 两 层 模型 ,434 
扩展 到 两 层 . 305 ~ 306 
例子 , 306 ~309 
总 体 平均 模型 ,287 ~ 290 
估计 , 432 ~442 
估计 上 的 考虑 , 315 ~316 
数值 积分 , 433 
分 最 系数 模型 , 76 
分 解 ,9 
估计 ,50 ~ 55 
假设 检验 , 62 ~63 
将 截 上 忠和 斜率 作为 结果 的 模型 ,79 ~ 83 
条 件 模型 或 残 差 模型 ,20 
无 条 件 模型 ，35 
分 析 单 位 ,4 
分 项 反应 模型 ， 定 义 ,351 
辅助 统计 量 
单 因 素 方 差分 析 , 70 
将 截 距 和 斜率 作为 结果 的 回归 模型 ，27 
类 别 效应 与 情景 效应 ，122 ~ 124 
系数 模型 ,82 ~ 83 
以 均值 作为 结果 的 回归 , 72 
复合 对 称 ， 个 体 变 化 , 181 ~ 182 


G 


个 人 层次 模型 ( 层 - 1) , 96 
个 人 层次 模型 〈 层 -2) ,个体 变化 ,153 ~ 154 
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个 体 变 化 
背景 问题 , 151 ~ 152 
对 个 体 变化 的 研究 , 151 - 194 
建立 模型 ,152 ~ 154 
认 知 增长 的 指导 效应 , 155 
组 织 之 内 的 , 225 ~ 232 
个 体 层次 与 构成 效应 ， 组 织 社会 学 , 131 ~ 134 
个 体 效应 的 改进 估计 , 6 
各 研究 之 间 的 层 -2 模型 ， 元 分 析 , 200 
各 研究 之 内 的 层 -1 模型 ， 元 分 析 , 199 ~ 200 
共管 制 模型 ，101 ~ 106 
估计 方法 ， 元 分 析 , 200 
估计 理论 , 37 ~55, 413 ~ 442 
贝 叶 斯 推断 综述 ,416 ~ 417 
最 大 似 然 估计 综述 , 415 ~ 416 
佑 计量， 模型 与 算法 之 问 的 区 别 ,378 
固定 层 -1 系数 ， 估 计 ,，128 ~ 131 
固定 效应 
标准 误 ， 常 规 教师 层次 与 学 校 层次 的 分 
析 , 104 ~ 105 
常规 教 病 是 次 与 学 校 层次 的 分 析 , 102 ~ 105 
单 因素 方差 分 析 , 68 
估计 , 38 - 45 
截 距 和 斜率 作为 结果 的 模型 ，79 
推断 ，267 
系数 模型 ,75 
以 均值 作为 结果 的 回归 , 71 
关键 解释 变量 ,两 层 组 织 效应 研究 , 149 ~ 150 
观察 得 分 , 45 
广义 最 小 二 乘法 (GLS) 估计 , 64 
过 离散 ， 定 义 , 316 


后 验 分 布 ， 贝 叶 斯 方法 ，380 
后 验 概率 分 布 ， 定义 , 399 
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后 验 区 间 、 定 义 . 399 
IA, 15 

异 质 性 ，147 

用 于 缺失 数据 , 318 ~ 327 

自 变 最 会 测量 误差 ,327 ~ 332 
FRUN 

回归 系数 , 22, 24 ~27, 36 

点 估计 , 40, 47 ~48 


区 间 估 计 , 41, 48 
示范 , 70 ~73 
汇总 偏 益 ,4 
混合 效应 模型 ,5 
J 


基于 模型 的 填补 ， 定 义 ，351 
基于 会 弃 整 个 缺失 案例 、 填 补 单独 的 缺失 
值 、 配 对 删除 元 模型 的 填补 ， 数 据 缺 失 
问题 , 317 ~ 318 
吉 布 斯 抽样 
贝 叶 斯 推断 , 405 ~ 410 
词汇 最 增长 数据 研究 , 406 ~ 410 
计算 方法 ， 贝 叶 斯 推断 , 405 ~410 
加 权 最 小 二 乘法 〈WLS) 估计 , 64 
假设 检验 , 55 -63 
贝 叶 斯 推断 , 377 ~ 380 
方差 协 方差 分 量 , 62 ~ 63 
分 屋 模 型 的 检验 类 型 , 56 ~ 62 
分 屋 模型 的 通用 检验 ,56 
三 层 模 型 , 222 ~ 223 
简单 分 项 反应 模型 ，333 ~ 338 
将 层 ~1 自 变量 对 中 ， 在 组 织 效 应 研究 中 ， 
127 ~ 141 
降 秩 数据 , 43, 50 
交互 单元 内 模型 《( 层 -1) 
定义 , 374 


交互 分 类 的 随机 效应 ,356, 359 
交互 分 类 的 随机 效应 
定义 , 374 
公式 与 模型 检验 ,356 ~ 364 
例子 ,364 -373 
模型 ,353 ~375 
结构 方程 模型 (SEM) ， 个 体 变化 , 176 ~ 179 
结构 模型 ， 定 义 ,315 
结果 变量 ， 扩 展 范围 , 9 ~ 11 
BRA, 245 
截 距 作为 结果 的 模型 , 22, 25 
个 体 变化 , 158 ~ 159 
类 别 效应 与 情景 效应 ,119 
示范 , 78 ~83 
用 于 区 分 组 织 效应 , 112 ~ 124 
解释 的 方差 ,72 ,77 
解 县 方差 统计 ， 常 规 教师 层次 和 学 校 层次 
的 分 析 , 102 ~ 106 
解释 性 模型 ， 层 -2， 教 师 效率 上 的 学 校 效 
应 , 100 ~110 
近似 + 的 纳入 统计 最 ， 层 -2 模型 ，256 
经 验 贝 叶 斯 残 差 , 47 
层 -2 模型 , 47 ~49 
经 验 贝 叶 斯 估计 , 46 
层 -1 残 差 , 65 
层 -1 系数, 64 
层 -2 残 差 , 65 
精度 , 39 
精度 加 权 平 均 数 , 39 
具体 单位 模型 ， 定 义 , 316 
具体 单位 模型 ， 对 比 总 体 平均 模型 , 289 ~ 290 
均值 作为 结果 的 回归 ,70 
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BY ARTE, 49, 64 





可 能 的 替代 模型 ， 三 层 模型 ,221 ~ 223 


可 信和 度 区 间 , 379 


拉 普 拉 斯 转换 

用 于 代表 积分 , 433 ~ 434 

用 于 两 层 二 分 类 数据 , 434 
累积 概率 模型 ， 单 层 数据 ,302 
连接 函数 ， 定 义 , 315 
二 参数 模型 ，350 -351 

EX, 352 


M 


种 族 差异 ， 类 别 效应 与 情景 效应 .121 
模型 的 假定 条 件 , 240 


P 


偏差 ,148 ~ 149 
平均 增长 轨迹 ， 个 体 变化 ,155 ~ 158 


Q 


期 户 最 大 化 算法 

用 其 进行 最 大 似 然 估计 , 417 ~ 421 
期 望 最 大 化 算法 (EM), 421 
潜在 变量 

定义 , 317 

两 岩 模 型 ， 个 体 增长 ， 342 - 345 

潜在 变量 模型 ，12 

有 关 分 层 线性 模型 ，317 ~ 352 

直接 与 间接 效应 , 332 ~ 345 
KRM, HEM, 316 
区 间 估 计 

贝 时 斯 方法 ,380 ~ 383 

贝 叶 斯 推断 , 377 ~ 379 

比较 , 90 ~91 
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单 因素 方差 分 析 , 40, 46 

更 一 般 的 模型 , 43, 50 

以 均值 作为 结果 的 回归 , 41, 48 
缺失 数据 

定义 , 190, 351 

苦于 多 元 模型 的 填补 , 319 ~ 320 

三 层 示范 例子 . 333 ~ 345 

随机 缺失 , 190, 319 

完全 随机 缺失 , 190, 319 

应 用 分 层 线性 模型 ,320 ~ 327 

应 用 回归 , 319 ~ 327 


S 


三 层 模型 
公式 与 检验 , 217 ~ 225 
假设 检验 , 222 ~223 
教学 的 研究 , 223 ~ 225 
可 能 的 替代 模型 , 221 ~ 222 
WLR, HEX, 399 
算法 、 模 型 与 估计 量 的 区 别 , 413 
随机 层 -1 系数 
对 某 一 特定 单位 的 估计 ,83 ~91 
估计 , 45-50 
假设 检验 ,60 ~ 62 
推断 , 270 
随机 截 距 寞 型 ,25, 35 
层 -1 协 变量 ,106 ~ 107 
写作 上 的 项 目 评估 , 107 ~ 112 
检查 教师 效率 的 学 校 效 应 , 99 ~ 102 
简单 模型 ，98 ~ 99 
组 织 共 同 效应 , 98 ~ 112 
随机 系数 回归 模型 ,5, 25 ~ 27 
个 体 变化 , 155 ~ 158 
示范 , 113 ~ 119 
随机 效应 ， 估 计 ， 367 
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随机 效应 模型 ,5 
随时 间 变 化 的 协 变 最 ,个 体 变化 . 170 ~ 176 
可 能 的 偏差 ,173 


SH 


社会 经 济 状 况 与 成 绩 的 关系 
1 个 学 校 . 15 ~ 17 
2 个 学 校 . 17 ~ 18 
JERE. 18 ~ 22 
社会 研究 ， 层 际 效应 建 模 的 例子 , 7 
WHF, ARER, 148-149 
双 因 素 交 互 分 类 的 数据 ， 定 义 ,，374 


T 
条 件 的 收缩 估计 
对 某 一 特定 单位 , 87 ~ 89 
估计 量 , 48 


条 件 的 组 内 相关 ,73 

条 件 分 析 ， 教 师 对 学 生 智 商 期 望 的 效应 ， 
204 - 207 

条 件 或 残 差 的 方差 协 方差 , 20 

HAE BT MLE, 73 

条 件 模 型 , 219 ~ 221, 229 ~ 232, 285 ~ 287, 
289, 300 ~301, 359 ~364, 366 ~ 367 

同 质 性 ， 层 -2 随机 效应 , 259 ~ 260 


w 


完全 随机 缺失 (MCAR)， 定义, 351 
完全 无 条 件 模型 , 217 ~219 
完全 最 大 似 然 法 (MLF), 51 
完整 数据 , 351 
稳健 标准 误 , 262 ~ 264 
应 用 常规 最 小 二 乘法 ,262 ~ 263 
应 用 一 般 最 小 二 乘法 ，263 ~ 264 
总 体 平均 模型 , 289 


无 条 件 的 方差 协 方 莽 ,35 
无 条 件 分 析 ， 教 师 对 学 生 智商 期 望 的 效应 ， 
202 ~ 204 
无 条 件 模型 ,226 ~229, 283 ~285, 287 ~ 289, 
291 ~295, 299 ~300, 306, 310 ~313 
无 条 件 收缩 , 64 
对 某 一 特定 单位 的 估计 , 84 ~ 87 
误差 方差 , 38 ~ 39 
误差 结构 
层 -1, 个 体 变化 , 153 
在 层 -1 和 层 -2 的 推广 , 30 
误差 削减 比例 ， 用 于 方差 统计 ，141 ~ 143 


x 


先 验 分 布 ， 贝 叶 斯 方法 ,380 
先 验 概率 分 布 ， 定 义 , 399 
线性 增长 模型 
分 段 线 性 增长 模型 ， 个 体 变化 , 168 ~ 170 
关于 个 体 变化 , 152 ~ 160 
其 截 距 的 定义 ,171 ~ 172 
小 样本 理论 ， 推 断 的 有 效 性 , 266 -271 
HIERREN, S 
协 方差 结构 ,180 
斜率 作为 结果 的 模型 ,22, 28 
个 体 变 化 , 158 ~ 159 
公立 与 天 主教 学 校 成 绩 的 社会 分 布 ， 
113 ~ 124 
类 别 效 应 与 情景 效应 ,119 
示范 , 78 ~83 
以 往 过 到 的 困难 , 112 ~ 113 
用 于 区 分 组 织 效应 , 112 ~ 124 
虚拟 变量 ,32 
BE, EX, 39 
学 业 差 异 ， 类 别 与 情景 效应 ，!119 
学 校 层次 模型 , 218 


学 校 平 均 成 绩 , 类 别 效 应 与 情 县 效应 ， 


125 ~ 127 
Y 


- 阶 自 同 归 或 称 AR (1) 模型 ,182 
有 效 估 计 ， 定 义 ,351 
元 分 析 
负 叶 斯 方法 , 207 ~ 208 
贝 叶 斯 方法 与 经 验 贝 叶 斯 方法 ,392 ~ 404 
残缺 的 多 元 数据 , 213 ~216 
层 -1 方差 已 知 时 的 问题 , 208 ~ 212 
多 元 方差 已 知 时 的 问题 , 212 ~ 213 
分 层 的 数据 结构 ，196 ~ 197 
关联 的 多 样 性 , 209 ~ 212 
建立 模型 . 198 ~ 201 
教师 对 学 生 智商 期 望 的 效应 , 201 ~ 207 
应 用 , 195 ~239 
约束 最 大 似 然 法 (REML) ，51 
中 时 斯 推断 ,387 ~ 389 
估计 ,414 


Z 


增长 参数 ， 及 其 方差 , 174 ~ 176 
增长 模型 ,个 体 变化 , 167 ~ 171 
自然 测量 ,31 
总 体 平均 模型 
定义 ,287 
对 比 具体 单位 模型 ,289 ~ 290 
分 层 一 般 化 线性 模型 (HMLM), 287 - 290 
组 合 模型 ,200 
组 内 相关 系数 , 23,71 
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组 织 层 次 模型 ( 层 -2), 97 ~98 
组 织 研究 


层 -1 自 变量 的 对 中 , 127 ~ 141 

对 学 校 业绩 的 常用 估计 ，144 ~ 146 

对 业绩 指标 进行 有 效 推断 所 面临 的 威胁 ， 
146 - 149 

个 人 层次 与 构成 效应 , 131 ~ 134 

估计 层 -1 系数 的 方差 , 135 ~ 140 

估计 随机 的 层 -1 系数 ,141 

建立 模型 . 96 ~98 

经 验 贝 叶 斯 估计 量 , 144 ~ 146 

特别 效应 的 概念 化 、143 

应 用 于 层 -1 有 异 质 性 方差 , 124 ~ 127 

在 控制 层 -1 协 变量 条 件 下 估计 层 -2 效 
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采用 期 望 最 大 化 (EM) 算法 , 52 ~ 54 

方差 成 分 的 置信 区 间 ,， 54 
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估计 , 415 ~416 

估计 多 元 分 层 线性 模型 (HMLM), 427 ~432 

通过 费 会 尔 得 分 的 估计 , 421 - 427 

通过 期 望 最 大 化 (EM) 方法 的 估计 , 
417 ~421 

完全 最 大 似 然 估 计 (MLF), 386 
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正 态 假定 ， 层 ~1 随机 效应 , 252 ~ 253 

正 态 性 ， 层 -2 随机 效应 , 260 

置信 区 间 ， 基 于 最 大 估计 的 各 种 分 量 ,54 
重复 测量 模型 ( 层 -1), 个 体 变 化 , 176 
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新 增 的 第 10 一 14 章 在 已 经 极 好 的 研究 和 示范 基础 上 又 做 
TR. 这 本 书 的 内 容 又 扩展 到 离散 型 层 - 1 结果 变量 的 模 
型 EENE - ?单位 模型 不 完整 数据 以 及 有 测量 误差 的 
模型 ， 这些 都 是 当代 社会 统计 中 至 关 重 要 的 问题 。 沿 着 第 1 
版 的 传统 ， 这 些 方面 都 得 到 了 清楚 的 讨论 并 辅 以 很 多 有 趣 的 
研究 实例 作为 方法 上 的 示范 。 高 年 级 研究 生 和 社会 科学 研究 
人 员 都 可 以 立刻 受益 于 内 容 扩展 的 新 版 及 其 他 在 研究 上 的 针 
对 性 

一 一 TED GERBER， 亚 利 又 那 大 学 社会 学 系 


阅读 第 11 章 时 也 同样 令 人 兴奋 ， 它 显示 了 在 应 用 EM 算法 
时 混合 模型 的 多 样 性 。 每 一 页 上 都 有 实践 方面 的 新 启示 。 我 
感到 有 关 说 明 都 极为 清楚 ， 就 好 像 是 被 领 着 从 一 个 宝藏 走 到 
另 一 个 宝藏 、 并 且 所 有 的 宝石 美玉 都 天 生 有 用 。 这些 问题 都 
是 研究 人 员 天 天 面 对 的 .而 这 一 章 给 我 们 提供 了 一 种 卓越 的 
新 方法 来 处 理 这 些 问 题 。 
一 一 PAUL SWANK ， 得 克 苹 斯 大 学 休斯顿 分 校 护 理学 院 
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